on-the-time.jp

2017年12月25日

唇の動きを画像認識し、会話を解読。

未来

AFPは、1952年に設立された中華人民共和国の国営通信社CNS(China News Service)のニュースをJCMが日本語訳した情報として、中国のIT大手「捜狗(Sogou)」が業界初となる画像認識と自然言語処理が一体となった口唇形状認識(Lip shape recognition/lip recognition technology)の技術開発に成功したと報告した。

これは、手話と同様に、耳が悪い人が音声認識に頼らず、話す人の唇の動きを画像認識することによって会話の内容を解読する口唇形状認識の技術を実現したことになる。

【広告】 九州のお医者様の奥様が、偶然使われ、凄く良いので九州まで送って欲しいと言われ、早速対応させていただきました。 これはどこで買えるの?と聞かれてしまいました。お店は銀座三越4階「アトリエロングハウス」TEL: 03-3562-7012で購入いただけます。よろしくお願いします。

手話を取得するのに、その内容が国によって異なるという難点があった。

私の知り合いは、日本語と英語の手話を取得していたが、国によっては全く通じなくなった。

この技術開発には、ディープラーニング(深層学習)を応用し、中国語の口の動きを数千時間かけて学習させた。
認識の正確率は60%以上で、Googleによる英語の口唇形状認識システムの正確率50%を上回った。

2017年12月05日から、中国・浙江省(Zhejiang)で行われた「世界インターネット会議烏鎮サミット(World Internet Conference,Wuzhen Summit)」で捜狗の口唇形状認識が初めて公開され、注目を集めた。

今後は、音声認識と画像認識技術を補助する「マン・マシン・インタフェース」の一つとして、さまざまな場面で広く応用されるだろう。

周囲の雑音が大きい場合、公共の場など声を発することができない場合、会話の内容を他人に知られたくない場合など、日常生活でも実用性が高い。

また、マイクの付いていない監視カメラにも応用できる。さらに、障害がある人や高齢者の意思疎通にも活用できる。

人工知能技術の発展に伴い、近い将来、口唇形状認識も音声認識や画像認識と同じように我々の生活に欠かせないものになるかもしれない。

私が最初に機械翻訳を富士通で見た時、正確率は70%以上であった。
まだまだ、これからということだろうが、当時は16ビット・マシンが主流で、人工知能も理論上であったことから、開発発展加速度に大きな差が出ることだろう。

【広告】 シャワーのときに、石けんで洗う必要がない。チェビー・チェイスの女性のための消化剤センターの創立者ロビーネ・チュツカン医学博士は、毎日シャワーと石けんで汚れをこすり落とすことによって、私達は、良いバクテリアを皮膚からはいでいるといっている。汗まみれの運動の後でさえ、「gaYa-3」でオイル・パックをして、洗い流すことによって、水では落ちない泥や垢などの汚れを清潔にできます。

【広告】 夏季後の汗によるかぶれ、肌荒れ、発疹が急増していることが放送されました。周囲の方に聴いたところ、ほとんどの人が悩んでいました。「ガヤ-3(gaYa no3)」を試していただいたら、調子が良いと言うことでした。 無料プレゼントの結果、多くの方に驚くほど感謝されました。ありがとうございました。秋になっても、これほど多くの方が、まだ悩んでいたことにも驚きました。

gaYa広告