第3次AIブーム

今回は第3次AIブームについて詳しく解説します。

第3次AIブーム
データ量の爆発的増加
1. ビッグデータ
機械学習(マシンラーニング)
1. 象徴的な出来事と社会実装
深層学習(ディープラーニング)

第3次AIブーム

1950年代後半から1960年代の第1次AIブームでは“推論と探索”のアプローチでAI研究が進みましたが、トイ・プロブレムのような簡単な問題しか対応できなかったこともあり、1970年代には米英でAIの研究資金供給が打ち切りになるなど、第1次AIブーム終焉後の”AIの冬”に突入していました。

その後、70年代後半から80年代にはエキスパートシステムの研究の進展とともに第2次AIブームが到来しますが、知識獲得のボトルネックなどの要因もあり、2000年代には再び冬の時代を経験します。第1次・第2次のAIブームについては以下をご参照ください。

2010年代以降現在まで続いている第3次AIブームの火付け役は、何といっても機械学習(マシンラーニング)とディープラーニング(深層学習)です。

データ量の爆発的増加

第3次AIブームが起こる呼び水となったのが、爆発的に増加したデータ量です。世界で初めてウェブページが作成されたのが1990年、パーソナルコンピューターの象徴であるWindows95の発売が1995年、Googleの検索エンジンが1998年、最大通信容量384kbpsの3Gが登場したのが2001年、スマートフォン普及の大きな最初の一歩となったiPhoneの発売が2007年、最大通信速度150Mbps程度の4G(LTE)が登場したのが2010年、2015年のLTE-Advanceでは最大通信速度は最大1Gbpsに迫っており、2020年には最大10Gbpsの5Gが登場しました。

ビッグデータ

この間、ごく一部の専門家にのみ使用されるものだったインターネットやコンピューターは普及し続け、2010年代には誰でもどこでもインターネットにアクセスできる時代になりました。これにより世界全体のデータ量は爆発的に増加します。

2000年には6.2EBだったデータ総量は、2010年時点で988EB、2020年に59,000EBと、20年間で1万倍に増えました。なおEBはエクサバイトのことで、kB(キロバイト)->MB(メガバイト)->GB(ギガバイト)->TB(テラバイト)->PB(ペタバイト)->EB(エクサバイト)の順で大きくなります。

こうして蓄積された膨大なデータ(ビッグデータ)を使った機械学習やディープラーニングによって、第3次AIブームが起きました。今となっては、”AI・人工知能”と言われるときにその実態が機械学習やディープラーニングのことであることが非常に多い、という状況になりました。

機械学習(マシンラーニング)

機械学習というのは、文字通り機械が自ら学習する仕組みのことです。英語ではML(Machine Learning)とも呼ばれます。別の言い方をすると、データから学習して自動で改善していくアルゴリズムのことです。

機械学習の研究自体は50年以上の歴史がありますが、ビッグデータの存在が研究を俄かに前進させ、成果を出し、社会実装が進みました。

象徴的な出来事と社会実装

2011年にアメリカのクイズ番組”Jeopardy!”に参加したIBMの人工知能ワトソンが人間と対戦し、勝利を収めました。

社会実装の例としては、ECサイトのオススメ商品(レコメンデーション)や迷惑メールフィルター(スパムフィルター)が挙げられます。

詳しくまた別の記事で説明しますので、少々お待ちください。

深層学習(ディープラーニング)

ディープラーニングも機械学習の一種ですが、その最大の特徴は、人間の神経回路であるニューロンを模した、ニューラルネットワークという仕組みです。

ニューロンとは何か

ディープラーニングの特徴であるニューラルネットワークを理解するには、まずニューロンというのが何なのかを理解する必要があります。

ニューロンは以下のような形をした神経細胞です。我々の脳が動くときには、ニューロンからニューロンに電気信号が流れています。ニューロンは我々人間の脳の構成要素で、成人の脳であれば100億~1,000億ほどのニューロンを持ち、それらの大量のニューロン間で3次元的で入り組んだ複雑なネットワークが構築されています。以下の図は非常に簡略化していますが、それでも入力から出力に至るまでに幾重にもニューロン同士のコミュニケーションが行われていることがわかると思います。

ネットワークが複雑すぎて、未だに人間の脳についてはわからないことがたくさんあるわけですが、言い換えると、人間の活動は入力に対する出力が単純な論理で説明できないということができます。

ニューラルネットワーク

そうした人間のニューロンの複雑なネットワークを模した数理モデルが、ニューラルネットワークです。初めはニューロンの層(上記の図でいえば、縦方向で並列しているニューロンを”層”とみなす)が少ないモデルから考案され、徐々に多層的なニューラルネットワークの研究が進みました。

象徴的な出来事と社会実装

そうした多層ニューラルネットワークを使ったディープラーニングによる象徴的な出来事が2012年のILSVRCです。ILSVRC(ImageNet Large Scale Visual Recognition CHanllenge)は2010年から2017年まで開催された大規模画像認識協議会です(その後は役割をKaggleに引継)。

2012年のILSVRCではディープラーニング(Deep CNN)を活用したトロント大学のでジェフリー・ヒントン教授のチームSuperVisionが圧倒的勝利を収めました。ヒントン教授は、2006年頃からのディープラーニング研究の牽引者です。2012年以降ILSVRCの覇者は遍くディープラーニングを採用しており、2015年には認識精度が人間を超えました。

また同じ2012年には、GoogleがYoutubeからランダムに抽出した画像から猫を特定するためのネットワークを構築したと報告されています。ある画像が猫か否かということは、人間には簡単に判断ができます。しかし、その根拠を明確にすることは簡単ではありません。人間のそういった判断は、人間のニューロンの複雑で多層なネットワークがあってこそなわけです。

第2次AIブームまでのエキスパートシステムでは、1枚1枚の画像を”猫”としてインプットする必要がありましたが、人間と同じように複雑で多層なニューラルネットワークによって、ディープラーニングは大きなブレークスルーを達成したのです。