知能を創る

人工知能、機械学習、深層学習のニュース記事を収集し、技術動向を調査していきます。

“ロボット大喜利”開幕 人工知能がボケる 来場者の表情でウケたか判定(ITmedia NEWS) - Yahoo!ニュース

“ロボット大喜利”開幕 人工知能がボケる 来場者の表情でウケたか判定 (ITmedia NEWS) - Yahoo!ニュース

目指すコンセプトは「AI妖怪」? 電通大、汎用人工知能研究拠点「AIX」キックオフ・シンポジウムを開催

pc.watch.impress.co.jp

AIXが目指すのは、普段は見えないが、VRやAR、MR機器を通じれば見られる、IoTなどを使ってさりげなく人を助けてくれるAIだ。これと、電通大水木しげる氏のお膝元である調布にあることから、「AI妖怪(YokAI)」なる汎用人工知能を目指していくと栗原氏はコンセプトを表現した。

基調講演は認知発達ロボティクスの第一人者であり、AIX顧問でもある大阪大学大学院工学研究科教授の浅田稔氏。浅田氏は「学際・融合からAI超域へ : 構成的発達科学への挑戦」と題して、「人工知能から人工共感、そして人工意識に繋がる構成的発達科学の試み」について講演した

特定の筋骨格系を持った生物の神経活動をシミュレーションすると、解剖学的構造が反映されて特定の活動パターンが出てくる。通常の歩行のときと非常に意識的な足運びをしているような状態では異なる状態が観測される。もしかしたらこれが意識と無意識を示しているのかもしれない。

意識に関しては最近、ジュリオ・トノーニによる「統合情報理論」が提唱する「φ」という量での意識の計測が話題になっている。定量化できれば不安定時の運動と安定時の運動との情報量の差や、各機能の分散や多様性についても興味深いことがわかるかもしれない。

 

人気ホテルが最大78%OFF
200社の予約サイトから料金を一括比較
最安値の宿泊プランをご案内
www.trivago.jp

にほんブログ村 ニュースブログ ITニュースへにほんブログ村

にほんブログ村 IT技術ブログ IT技術情報へにほんブログ村

グーグルの人工知能、今度は「モザイク画像の被写体を特定」する

wired.jp

グーグルの研究チームは、人間には何が写っているかほとんど認識できないような人の顔や部屋を写した低解像度の画像から、元の画像を推測・再現する人工知能システムを開発した。防犯などに応用できる可能性がある。

このシステムでは、「conditioning network」と「prior network」という2種類のニューラルネットワークを組み合わせて画像を解析し、8×8ピクセルという低画質画像から、32×32ピクセルの高解像度ヴァージョンを生成している。

まずconditioning networkは、低解像度画像を任意の高解像度画像と比較することで、そこに写っているのが顔なのか部屋なのかを判断する。

次に「PixelCNN」(CNN:畳み込みニューラルネットワーク)を使用するprior networkが、8×8画像にピクセルを追加する。『Are Technica』UK版の記事によると、PixelCNNは既知の画像を利用して細部を追加するという。たとえば、唇はピンクであることが多いので、唇だと判断された領域にはピンクのピクセルを追加するという具合だ。

それぞれのニューラルネットワークの処理が終わると、グーグルの研究者たちがその結果を組み合わせて最終画像を生成する。「顔の典型的なヴァリエーションを前もって学習することで、AIは細部をリアルに描画することができる」と研究者たちは書いている。

 

人気ホテルが最大78%OFF
200社の予約サイトから料金を一括比較
最安値の宿泊プランをご案内
www.trivago.jp

にほんブログ村 ニュースブログ ITニュースへにほんブログ村

にほんブログ村 IT技術ブログ IT技術情報へにほんブログ村

ディープラーニングの仕組みと応用

詳説 人工知能 - ディープラーニングの仕組みと応用:ITpro

 

基本的な仕組みの次は、ディープラーニングの適用領域を見ていこう。主に音声認識、画像認識、言語処理の三つがある

このうち、最も進んでいるのは音声認識の分野である。
短時間区間の音声から音素(語と語の意味を区別する機能を持つ音声の最小単位)を推定する音響モデルの部分で活用が進んでいる。

ただし、外部のノイズが大きい、残響があるなど、学習環境と利用環境に大きな違いがある場合は、ディープラーニングでも認識精度は低い。
最近は言語モデルを利用することによって、単語や文中の単語のつながりの情報を活用し、音声認識の精度向上を図る取り組みも進んでいる。言語モデルには、自然言語処理の分野で近年活用が拡大している再帰ニューラルネットワークが利用されている。

続く画像認識は、ディープラーニングで現在、最も注目を集める適用領域だ。PoC(Proof of Concept:概念実証)が盛んで、実用化も進みつつある。
静止画像の画像分類のような単純タスクでは、ディープラーニングは既に人間より高い認識率を実現したと言えよう。最近では、こうした簡単なタスクではなく、物体の領域を画素レベルで分離するセグメンテーションや動画像処理の分野の研究開発が進められている。

このように音声認識や画像認識が成果を上げる一方、自然言語処理の分野での成果は今のところ限られる。
ディープラーニングの適用分野は、ニュースの要約や欧米言語間の翻訳などに限られる。
興味深い成果もいくつか出てきた。その代表例は、単語や文章の意味などを数百次元ほどの固定長ベクトルで表現する「分散表現」である。

 

この状況を変えたのはGoogleだ。同社はニューラルネットワークを使用することによって、高速に分散表現を構築する手法を2013年に考案。
しかもGoogleがこの手法を「word2vec」というオープンソースソフトとして公開した。これによって多くの自然言語研究者が分散表現を活用するようになっている。
word2vecのように演算で単語の意味を類推できる仕組みがあれば、辞書作成の手間の省力化が期待できる。

 

 

人気ホテルが最大78%OFF
200社の予約サイトから料金を一括比較
最安値の宿泊プランをご案内
www.trivago.jp

にほんブログ村 ニュースブログ ITニュースへにほんブログ村

にほんブログ村 IT技術ブログ IT技術情報へにほんブログ村