AI(人工知能)の記事を読んでいる際に、少し技術的な内容を扱う文章によく「API」という言葉が登場しますよね。「API」は、エンジニアだったりIT企業に勤めている方でない限り、普通は知らない専門用語であると言えるでしょう。
単語の意味を知っておくだけで、今後AI(人工知能)関連の記事を読む際には、記事全体の理解度もきっと上がってくるはずです。そこで今回は、「API」とは何か?についてお伝えしていきます。
一言で言うと「API」とは・・・
他人が開発したプログラムを外から利用するための連携の仕組みです。
APIは外から連携することで開発の負担を軽減できる便利な仕組み
APIとは、Application Program Interface(アプリケーション プログラム インターフェイス)の略で、他人が開発したプログラムの外から利用するための連携の仕組みです。このAPIがあることによって、欲しい機能をわざわざ自分で開発する必要が無くなるため、非常に便利なツールと言えます。
つっちー
インターフェイスとは、「ソフトウェアとプログラムをつないでいるもの」という意味です。
AI(人工知能)関連の記事でよく出てくるのは、学習済みの機械学習モデルを利用できるAPIです。これには様々な種類があり、例えば画像から人の顔を検出して、年齢や性別、表情から本人の感情を分析するもの、映像の中にどんなものが、どのくらい、どのタイミングで写り込んでいるか、といった解析を可能とするAPIもあります。
代表的な主な学習済みの機械学習モデルのサービス
代表的な主な学習済みの機械学習モデルのサービスには以下のものがあります。
画像認識
- Amazon Rekognition(Amazon Web Services):著名人を認識
- Computer Vision API(Microsoft Azure):画像内に何が写っているのかを提示
- Vision API(Google Cloud Plattform):画像の内容を理解、画像内のテキストを検出
音声認識・発話
- Speech Service(Microsoft Azure):音声テキスト変換、テキスト読み上げ、音声翻訳
- Polly(Amazon Web Services):テキスト読み上げ
- Speech to Text(IBM):音声テキスト変換
対話
- Amazon Lex:会話を実現
- Bot Framework(Microsoft Azure):会話を実現
- Watson Assistant (旧Conversation):会話を実現
翻訳
- Cloud Translation API(Google Cloud Platform):翻訳
- Language Translator(IBM Watson):翻訳
- Translator Speech API(Microsoft Azure):音声翻訳
動画処理
- Cloud Video Intelligence(Google Cloud Platform):動画分析
- Video Indexer(Microsoft Azure):動画分析
このように、用途に応じて様々なAPIが現在提供されています。
まとめ
つまり「API」とは、
他人が開発したプログラムを外から利用するための連携の仕組みです。活用したい機能を自分で開発する手間が省ける非常に便利なツールで、様々なサービスが現在提供されています。
<参考>
つっちー
AI(人工知能)って「なにそれ美味しいの?」ってレベルだった僕が、AIエンジニアを目指してステップを踏んだり踏まれたりしている記事を書いてます。よかったら読んでみてください(実話)。
コメントをどうぞ