Mistral AI：OpenAIに迫るフランス発の大規模言語モデルスタートアップ

ChatGPTが2022年にリリースされて以来、多くの企業やベンチャーキャピタルが生成AIスタートアップへの投資に注力しています。

この記事では、フランスに拠点を置くオープンソースの大規模言語モデルを開発する生成AIスタートアップ「Mistral AI」の紹介を行います。

Contents

1 Mistral AI 基本情報
2 創業者・経営陣
3 プロダクト
- 3.1 特徴
4 オープンソース大規模言語モデル利用のメリット
5 まとめ

Mistral AI 基本情報

会社設立年	2023
本社所在地	フランス　パリ
プロダクト	オープンソースの大規模言語モデル
従業員数	18人　（2023年9月時点）
直近投資ラウンド	Seed (2023年6月）
累計資金調達額	約165億円　（1€ = ¥157 換算）
既存投資家	Lightspeed Venture Partners、 Motier Ventures、La Famiglia、Headline、Exor Ventures、Sofina、First Minute Capital、LocalGlobe　など

Mistral AIは、フランスのパリに拠点を置くスタートアップ企業です。

同社は設立後わずか数週間で実施したSeedラウンドにおいて、製品がまだ存在しないにもかかわらず、165億円という驚異的な資金調達を達成し、業界内で大きな注目を浴びました。

Seedラウンドの主要な投資家として、シリコンバレーの著名なベンチャーキャピタルであるLightspeed Venture Partnersがリードインベスターを務め、その支援によってMistral AIの成長に強力な後押しがされています。

創業者・経営陣

Mistral AIは、2023年に設立された企業で、AI研究の第一線で活躍する3人の専門家によって創設されました。

Mistral AI 創業者: Guillaume Lample, Arthur Mensch, Timothée Lacroix — Mistral AI 共同創業者: Guillaume Lample, Arthur Mensch, Timothée Lacroix

この3人のAI研究者のうち、Timothée LacroixとGuillaume Lampleという二人は、Meta（旧Facebook）出身であり、もう一人のArthur Menschは、Google傘下のイギリスのDeepMind社の出身です。

彼らは、先端技術の分野での経験を豊富に持つエキスパートであり、その知識と洞察力をMistral AIのプロジェクトに活かしています。

技術の進化は、オープンソースコミュニティによって大いに推進されてきました。そのため、生成AIや大規模言語モデルのような新たな技術も、Linuxなどのようにオープンコミュニティによって発展していく必要があります。

Mistral AIの創設者たちは、この理念に基づき、オープンソースの大規模言語モデルの重要性を強調し、その発展に貢献するために同社を設立しています。

プロダクト

「Mistral 7B model」という名称のオープンソースの大規模言語モデルが開発されています。

このモデルはその名の通り、パラメータ数が7.3 Billion（73億）に達しています。

この大規模言語モデルは、ChatGPTと同様に文書生成、プログラムコード生成、要約などのさまざまなユースケースで利用可能です。

OpenAIのGPT-4のようなクローズドソースの大規模言語モデルは、そのソースコードが非公開であるため、一般的に利用者はAPIを使用するためにライセンスを購入する必要があります。

対照的に、Mistral AIのモデルはオープンソースであり、そのソースコードが一般に公開されています。

このモデルは、AIモデルのリポジトリであるHugging Faceなどからダウンロード可能です。これにより、開発者はソースコードをカスタマイズし、性能向上を試みることができます。

ダウンロードしたモデルは、Azure、AWS、Google Cloudなどのクラウドサーバやオンプレミスサーバなど、利用者が選択した環境にデプロイできます。デプロイされたモデルは、OpenAIのAPIと同様に、APIを介して利用可能です。

この柔軟性により、ユーザーは自身のニーズに合わせてモデルを展開し、さまざまなアプリケーションに応用することができます。

特徴

モデルの特徴としては、以下となります。

Apache 2.0 Licence　（誰でも（個人でも企業でも）・商用利用・改変・再配布可能）
軽量　（コンピュータの計算コストが少ない≒処理時間が短い）

※Apache 2.0 Licenceの詳しい利用条件については各自ご確認ください。

Metaが提供する同じくオープンソースのLlama 2より各種ベンチマークで優れている点が売り文句となっています。

出展：Mistral AI Blog https://mistral.ai/news/announcing-mistral-7b/

Mistral AIが公表したベンチマークテストの結果を参照すると、計算、コーディング、読解などの多岐にわたるタスクにおいて、LLaMAのモデルと比較し優越性を発揮していることが確認できます。

オープンソース大規模言語モデル利用のメリット

オープンソースの大規模言語モデルの利用は以下のようなメリットがあると考えられます。

システムの透明性とセキュリティの確保

オープンソースの大規模言語モデルを使用することで、システムを構築する際にプロンプトデータを外部ネットワークに送信する必要がありません。これにより、プロンプトデータのセキュリティとプライバシーが確保されます。

一方、外部サービスでは、ユーザーの入力データが学習に使用される可能性があり、その運用方法が不透明です。

オープンソースモデルを使用することで、透明性が高まり、企業や個人は安心してシステムを利用できるでしょう。

コスト削減

オープンソースの大規模言語モデルを利用する際には、ライセンス費用が発生しないため、中長期的には有料サービスとして提供されるモデルを使用するよりもコストを削減できます。

ただし、クラウドサーバの利用費用や初期のシステム構築費用は考慮する必要があります。

オープンソースコミュニティによるアップデート

オープンソースの大規模言語モデルは、ソースコードを変更できるため、企業や個人が機能の追加や改善を行い、モデルをアップデートできます。この柔軟性により、モデルは進化し続け、新しいニーズに対応できると期待されます。

オープンソースのアプローチは、透明性、経済性、カスタマイズ性の観点から、大規模言語モデルの採用において魅力的な選択肢となっています。

企業や個人は、これらの利点を最大限に活用し、革新的なアプリケーションとサービスを開発する道を切り拓くことができるでしょう。

まとめ

生成AI技術の台頭は、デジタル時代の新たなる領域への驚くべき飛躍をもたらしました。これは、インターネットとモバイル技術に続く、革命的なテクノロジーの波として称賛されています。そして、これらの革新は今後ますます成長し、私たちの社会に浸透していくでしょう。

生成AIの技術基盤である大規模言語モデルの透明性は、その発展において不可欠な要素となっています。私たちは、これらのモデルがどのようにデータを利用、保管し、情報を生成するのかを理解する必要があります。透明性がなければ、我々は信頼性を持ってこれらのモデルを活用することが難しくなります。

この点で、オープンソースの大規模言語モデルは特に重要です。オープンソースのアプローチは、透明性と共同作業を促進し、多くの人々がモデルの改善に貢献できるプラットフォームを提供します。そのため、将来的にはオープンソースの大規模言語モデルの重要性が一層高まるでしょう。

Mistral AIは、このオープンソースの大規模言語モデルの分野でどのようなポジショニングをとるのか、今後非常に注目されるでしょう。彼らが透明性と協力を奨励し、AI技術の発展に貢献する方法に焦点を当てるかどうかが、生成AIの未来に大きな影響を与えるでしょう。

彼らの動向を継続的に追跡し、彼らの取り組みが技術の進化にどのような革命をもたらすか、今後も目が離せません。