Share

BUSINESS

イスラエル発ジェネレーティブAIを開発したAI21 Labs|MobileEyeで有名なアムノン・シャシュアが創業

by 新井 均 |2023年03月13日

あまり技術に興味がない人であっても、最近話題の“ChatGPT”という言葉を聞いたことがあるのではないだろうか? 米国企業Open AIが開発し、2022年11月30日に公開したチャットボットと呼ばれるツールで、AIと「対話」ができるプログラムである。対話をする、とはこんな感じだ。


使用例

Google検索であれば、「ChatGPT 仕組み」というクエリを入力すると、関連するコンテンツを持つWEBサイトのリストが表示される。ユーザは自らそれらWEBサイトの内容を調べることにより求める情報にたどり着くが、ChatGPTの場合は、図のようにあたかも専門家が回答するような自然な文章が生成され、対話として返してくれる。その革新性が話題となり、公開後わずか2ヶ月でアクティブユーザ数が1億人に達した。


大まかなChatGPTの仕組みと歴史

もともとOpen AIは非営利の研究機関として5年前にスタートし、GPT(Generative Pretrained Transformer)と呼ばれる言語モデルを開発してきた。従来のAIは大量のデータを学習することにより、例えば顔やレントゲン画像の“認識・解析”などで使われてきたが、このGPTではAI自体が“何かを作り出す”という特徴から生成AI(Generative AI)と呼ばれる。大元はGoogleの翻訳研究から生まれたTransformerというモデルである。機械学習の自然言語処理モデルを発展させたもので、大規模なテキストデータを学習し文章中のキーワードの関係を推論してゆく。例えば、「彼はイスラエルワインを2本買った」という日本語を「He bought two bottles of Israeli wine.」という英文に翻訳するには、図のような日本語・英語間での単語の関連付けや順序の並べ替えを行われることが想像できるだろう。



大変大雑把に言えば、各単語に番号をつけ、入力の順序や相互の関連から適した順番の番号出力を生成するというような作業をしていることになる。より多くのテキストデータを学習すれば、単語間の関連付けや語順の並べ替えの精度がより向上することが想像できるのではないだろうか。本をよく読んだ人のほうが、良い文章が書けるようなものだ。


OpenAIはTransformerを活用した大規模言語モデルGPT2を2019年に開発した。このときのパラメータ数が15億だったのに対し、2020年に発表されたGPT-3は1750億!のパラメーターを持つ大規模な言語モデルであると言われている。モデルを大規模にすることで、人間が書いた文章と見分けがつかないような文章を書くことができるようになったり、長い文章を要約したりできるなど、研究者も驚くような革新的な進化を遂げた。


2019年3月にOpen AIはcapped-profit(利益上限つき)という形の会社組織へ移行した。株主へ一定の利益を還元した後、それを超える分は非営利団体が管理する仕組みだという。そして、マイクロソフトが10億ドルを出資、GPT-3の独占ライセンス契約を結んだ。昨年11月に誰でも使えるようなサービスとして公開されたために多くの人が試用し、その凄さが一気に話題となっているのである。話題の一つは、自然な文章の中で誤情報が入る(嘘をつく)というものだが、GPTは文章を生成するAIであり検索エンジンではないので、ある意味当然のことだ。ただし、マイクロソフトは検索エンジンBingとGPT-3を組み合わせることで、Googleの牙城である検索分野の勢力図を変えようとしている。またMSワードと組み合わせることで、様々な原稿作成が容易になるとも言われている。いずれにせよ、我々はAIのdisruptiveとも言える進化を目の前にしている。


イスラエル企業『AI21 Labs』は“生成AI”を開発

この驚くべきイノベーションを目前にして筆者が次に考えたのは、イノベーション大国イスラエルからはこのような技術は出てこないのだろうか?という単純な疑問だった。なぜなら、ChatGPTはコンピュータサイエンス、AI領域での技術革新であり、イスラエルがもっとも得意な分野の一つであるからだ。そこで色々調べてみたところ、やはり同様の技術・製品を開発している企業がイスラエルにあった。



2017年11月に設立されたAI21 LabsというAIの研究開発を行う企業である。創業者は、スタンフォード大学名誉教授のヨアブ・ショハム教授(Yoav Shoham)、CrowdX創業者のオリ・ゴーセン(Ori Goshen)、そして会長のアムノン・シャシュア教授(Amnon Shashua)である。言うまでもなく、アムノン・シャシュアは自動運転の基盤となる技術を開発したモービルアイ(Mobileye)の創業者であり、2017年にインテルが153億ドルで買収するというイスラエルスタートアップ最高の成功事例を作り上げたアントレプレナーである(関連記事)。


モービルアイは、カメラで撮影した画像を認識し、地図を自動生成する仕組みを開発した。また、彼が創業した別の会社、オーカムテクノロジーズは、カメラが撮影した新聞や人の顔を認識して音声で読み上げる小型のデバイスを開発し、視覚障害者のサポートをしている(関連記事)。つまり、画像処理とAIに関する多大な蓄積のあるアントレプレナーが、今度は言語処理分野に乗り出したのだ。彼が創業メンバーであるというだけで期待が膨らむ。


彼らは、Jurassic-1というGPT-3に匹敵する言語モデルを開発した。パラメータ数でもChatGPT同等の規模であるという。そして、彼らの製品、AI21 Studio はこのJurassic-1言語モデルへのAPI(アプリケーションインタフェース)アクセスを提供するのである。ChatGPTは現在誰でも無償で使えるサービスとして公開されているが、AI21 Studio は、大規模言語モデルを利用したアプリケーションを開発したいと考える企業にJurassic-1が利用できるようなインタフェースを有償で提供している。つまりビジネスユースをターゲットにしているため本当に顧客となる可能性のある企業へ届けば良く、マイクロソフトのような派手な発表をしていないのだろう。


AI21には次の4つの機能が用意されている。


AI co-writer : アプリに埋め込むことで、下書き生成、言い換え、オートコンプリートなど
AI co-reader : 長いドキュメントを要約、重要な点を抽出
AI business insights : 構造化されていないテキストの理解。トピックの分類やセンティメント(感情、意見)の分析など AI content automation : 下書き、編集など、あらゆる執筆プロセスの中での反復的作業を自動化


これらの機能をもとに開発者が言語処理ベースのアプリケーションやサービスを開発することを考えたときに、AI21 Studio のAPIを利用すれば開発が容易になるのである。AI21 Studioを説明するビデオがあるのでご覧頂きたい。



また、AI21 Studio以外にWordtuneとWordtune Readという2つの製品も用意されている。


Wordtuneはケースに応じて、言いたいことをより適切に表現することができる。例として、“I have some exciting news to share with you”という文章を対象にして、以下のように5つの書き換え事例を示している。ビジネス文書、プライベートの手紙など、場合に応じて適切な表現に書き換えることができるわけだ。


Rewrite it                I can't wait to tell you about what happened
Make it Casual       You'll never guess what happened
Make it Formal      I am thrilled to let you know that we have some very exciting new developments to share with you
Shorten it               I have great news
Expand it               I have some very exciting and important news to share with you all today


Wordtune Readは、長い文章を要約する機能である。学術論文や詳細なレポートを読み込み解析するような仕事では、重要なトピックを検出してそれに焦点をあてた要約ができるために、業務の効率化が図れるようになるだろう。その結果、研究、調査のような地道な仕事の進め方が変わってくると考えられる。


WEBサイトから理解する限り、APIを提供している点以外にはChatGPTとi21 Studioとの大きな違いは見られなかったが、実はこの記事を書いている最中の3月2日にChatGPTもAPIを公開した。正にAI21 Studioと正面からぶつかってくる。AI分野では技術の進歩があまりに早く怖いくらいだが、これからどのような世界が拡がるのか楽しみでもある。