無料で公開されたMSの人工知能Project Oxfordの実力

ここ最近、人工知能や機械学習に関する記事をたくさん見るようになりました。パソコンやプログラムに関係のない人でも聞いたことがあるくらい世の中にその 言葉が広まりつつあります。そこで今回はMicrosoftが開発したProject Oxfordの人工知能をはじから触ってみましょう。Project Oxfordは以前から存在していたのですが2015年12月頃にバージョンアップしかなり使いやすいもになりました。早速使っていきましょう。

Microsoft Project Oxford が使えるようになるまで

まずはアカウント登録

Project Oxford を使用するにはMicrosoftアカウントが必要になります。公式サイトからアカウントの作成を行ってください。

Project Oxford の内容

Project Oxfordの中には大きく分けてVision,Speech,Languageの3つが存在します。それぞれを簡単に内容を確認していきましょう。英語力があまりないので簡単な説明になってしまいますが参考にしてください。

Vision

Computer Vision API

  • 写真の詳細をアルゴリズムで抽出し何が映っているかやサイズ、色などを教えてくれる。
  • 写真からテキストを抽出し文字に起こしてくれる。
  • 写真をさまざまなサイズにトリミングし適切なサムネイル画像を提案してくれる。

Face API

  • 画像から顔を検出する。顔のパーツの位置や年齢なども統計的に解析し判別してくれる。
  • 2つの顔を比べる。
  • 一番近い顔をたくさんの顔の写真の中から探す。
  • 顔のグループ分けをしてくれる。

Emotion API

  • 画像の表情から怒り、軽蔑、嫌気、恐れ、幸せ、普通、悲しみ、驚きを読み取りすべて数値化して表現してくれる。

Video API

  • 動画の手ぶれ補正を行ってくれる
  • 動画上の顔の検出
  • 動画上の動きの検出

Speech

Speech API

  • 音声から言葉を抽出しテキストデータにしてくれる。
  • テキストデータから音声データにすることもできる。

Speaker Recognition API

  • 音声からどの人物の声かを判断することができる

Custom Recognition Intelligent Service

Language

Spell Check API

  • 文字のスペルを確認し間違えを教えてくれる

Language Understanding Intelligent Service

Web language Model API

  • スペースなしで打ち込んだ文章をスペースで区切ってくれる

まとめ

このなかで何個か回数制限はあるものの、無料で使用可能なのでPythonなどのプログラミングが書ける人はやってみても面白いかもしれません。何個か自分で作ってみているので紹介していきます。

MSの人工知能APIを使って顔認識をしてみる
Microsoft Project Oxford Face API を使ってみよう Microsoft Project Oxford 内に...
スポンサーリンク
レンダリング大
レンダリング大

シェアする

  • このエントリーをはてなブックマークに追加

フォローする