MLXは終わらない、でも重心は変わる——MacローカルLLMが「動けばいい」から「アプリの部品」になる日
WWDC 2026のCore AI Frameworkと.aimodel形式は、MLXやGGUF中心だったMacローカルLLMの開発文化をどう変えるのか。実験の自由と、製品組み込みの安定——二つの流れのこれからを整理する。
WWDC 2026のCore AI Frameworkと.aimodel形式は、MLXやGGUF中心だったMacローカルLLMの開発文化をどう変えるのか。実験の自由と、製品組み込みの安定——二つの流れのこれからを整理する。
📑 目次
ふむふむ。
AFM 3 Core AdvancedやCore AI Frameworkの記事を書いたあと、ひとつ頭に残った問いがありました。
「MLX、これで終わっちゃうの……?」
MacでローカルLLMを触ってきた人なら、この不安、ちょっとわかるはず。MLXはApple公式の機械学習フレームワークで、Pythonから気軽に使えて、Metalに最適化されていて、研究にもプロトタイピングにも強かった。GGUFとllama.cppのコミュニティも含めて、MacローカルLLMの文化は「まず動かす」から始まってきた。
そこに、WWDC 2026で .aimodel という新しい形式と、Core AI Frameworkという新しいスタックが登場した。しかもBackground Assetsによる配信やAOTコンパイルまで含む、OS準拠の実行・配布の統合スタック として。
この記事では、MLX/GGUF中心だったMacローカルLLMの世界が、.aimodel の登場でどう変わるのか——「MLX終了」説を一度真面目に考えたうえで、実際にはどんな役割分担に向かいそうかを整理してみます。
「まず動かす」文化——MLXとGGUFが築いたもの
MacローカルLLMのここ数年の歩みを振り返ると、それは「動かすこと」そのものが成果だった時代です。
- llama.cpp + GGUF:量子化モデルをCPUで動かす。Apple Siliconの統一メモリを活かし、70BクラスでもMac Studioなら動く。
- MLX:Appleの機械学習研究者が作ったフレームワーク。NumPyライクなAPIで、PyTorchユーザーにも馴染みやすい。最新モデルの試走・LoRAファインチューニング・研究プロトタイピングに強い。
- LM Studio / Ollama / MLX Community:GUIやCLIでモデルを選んで起動。サーバーを立ててAPI化するのも手軽。
この文化の暗黙の前提は、「動かす人が、動かし方を知っている」 ことです。
- モデルをHugging Faceからダウンロードして
- 量子化形式を選んで
- llama.cppをビルドするかMLXのスクリプトを書いて
- 場合によってはトークナイザーを自分で読み込んで
- サーバーを起動してポートを開けて
これ、エンジニア個人のマシンでは「楽しい」んです。でも、「アプリとして誰かに届ける」 段階になると、この自由が一気に負債になります。
Core AI Frameworkが解決しようとしていること
ここで、改めてCore AI Frameworkの設計を見てみます。
WWDC 326のセッションで示されたのは、ただの「新しいモデル形式」じゃないんです。
| これまでの課題 | Core AIの答え |
|---|---|
| モデル形式がバラバラ(GGUF, MLX, SafeTensors…) | Appleアプリ組み込み向けには .aimodel へ集約 |
| トークナイザー管理を自前で | resource folder として同梱 |
| アプリ化すると外部プロセス・ポート管理が負債になりやすい | プロセス内で直接推論しやすい |
| アプリに同梱するとバイナリ肥大化 | Background Assetsでオンデマンド配信 |
| 初回起動が重い | AOTコンパイルで事前最適化 |
| クラッシュ時の復帰が自前 | システムレベルのセッション管理 |
| デバッグ・プロファイリングが手探り | Core AI Instrumentsテンプレート |
つまり .aimodel は、「モデルを動かす」だけの形式じゃなくて、「モデルをアプリの安全な部品として組み込む」ための実行・配布スタック なんです。
チカちゃん的には、この違いがすごく大きいと思ってます。
MLX時代:「Pythonで推論スクリプトを書いて、サーバーを立てて、APIを叩く」 Core AI時代:「変換・配信の準備をしたうえで、Swiftのアプリコードから自然に呼ぶ」
これ、どっちが「アプリ開発」として自然かというと、言うまでもないですよね。もちろん、変換・配信・初回ダウンロード設計まで含めれば数行で全部終わるわけではありません。でも、「アプリコードの中から直接モデルを呼べる」 ことのインパクトは小さくないです。
ℹ️ ここでいう「
.aimodelが強くなる」は、MacローカルLLM文化全体がひとつの形式に置き換わるという意味ではありません。Appleプラットフォーム向けの製品アプリに組み込む場面で、標準的な受け皿になっていく、という意味です。
MLXは終わらない——でも「主戦場」は変わる
で、ここからが本題です。
「じゃあMLXは終わりなの?」というと、チカちゃん的には**「終わらない。でも、メインの居場所が変わる」** だと思います。
理由を整理すると:
MLXが今後も強い領域
- 研究と実験:新しいアーキテクチャの試走、学習済みモデルの素振り、LoRAの実験。研究者がPythonでさっと書いて試すには、MLXの軽さと柔軟性は今も最強。
- 最新モデルの即日対応:Hugging Faceに公開されたばかりのモデルを、変換スクリプトを書かずにすぐ動かせる。コミュニティのスピード感は、公式スタックよりどうしても早い。
- 学習・ファインチューニング:MLXは推論だけでなく学習もできる。Core AIは現時点では推論特化に見える。
- クロスプラットフォーム研究:MLXのコードはLinuxでも動く(CUDA backend)。macOSに閉じない研究にはこれが必要。
.aimodel が強くなる領域
- 製品アプリ、App Store配布:アプリケーションにLLMを組み込むなら、Background Assets + AOTコンパイル + Instruments診断の統合パッケージは圧倒的に楽。
- Swiftネイティブ開発:Core AIで読み込んだモデルを、Foundation Modelsの
LanguageModelSessionに差し込める体験は、MLXのPythonスクリプトをSwiftから呼ぶより遥かに自然。 - 安定性と責任分界:メモリ管理、初回specialization、応答なしの診断などを、OS/Xcodeの標準ツールチェーンに寄せられる。
- 非エンジニアを含むチーム開発:モデルの準備・配信・診断まで含めたツールチェーンがXcodeで完結するので、MLエンジニア以外も参加しやすい。
つまり、「実験はMLX、製品化は.aimodel」 という役割分担です。
これ、チカちゃん的には「どっちが勝つ」の話じゃなくて、「同じチームの中で、フェーズによって道具を持ち替える」 という、むしろ健全な分業なんじゃないかと。
GGUF/llama.cppはどうなる?
GGUFとllama.cppのコミュニティも、同じ構図です。
- 利点:量子化の自由度が高く、幅広いハードウェアで動く。Mac以外のプラットフォーム(Windows、Linux、Android)でも使える。
- 課題:公式の配信パイプラインがない。セキュリティ境界やOSレベルのハードウェア活用は、Core AIほど標準パイプラインに乗りにくい。
おそらくGGUFも、「まず動かす」「どんなマシンでも試す」用途では生き残ります。ただ、Mac/iOSアプリに組み込む という文脈では、.aimodel がデフォルトになっていく可能性が高いです。
「動くもの」から「部品」へ——開発文化の地殻変動
ここからは、ちょっと大きな話になります。
ここ数年のローカルLLM文化は、「なんとか動かす」 に価値がありました。低bit量子化なら、従来考えにくかったサイズのモデルが手元のMacで動く——それだけでニュースになった。量子化の工夫、コンテキストサイズのチューニング、プロンプトフォーマットの調整——全部が手探りで、全部が楽しかった。
でも、Core AI Frameworkの登場は、その「手探りの楽しさ」を、少し違う場所に移そうとしている 気がします。
モデルを動かすこと自体は、「もうOSがやってくれる」。
開発者は、「動いたあと、何を作るか」 に集中できる。
これは、ローカルLLMが「研究対象」「趣味の道具」から、「製品の構成部品」 に格上げされる瞬間かもしれません。
チカちゃん的には、ちょっと寂しい気もするんです。Pythonスクリプトを書いて、量子化のパラメータをいじって、初めて70Bモデルが動いたときの興奮——あれは「手作り」の喜びだった。
でも同時に、「誰にでも安全に届けられる」 ことも、同じくらい大事です。MLXで動かす喜びを知っているエンジニアが、Core AIで誰かの手に届くアプリを作る——その両方を持てるのが、いちばんいい未来なんだろうなと、チカちゃんは思います。
まとめ——MLXは終わらない、でも問いは変わる
「MLX、終わっちゃうの……?」
終わらない。でも、「MLXで何を動かすか」から、「MLXで試したものを、どうアプリにするか」 に、重心が移っていく。
- 研究・実験・試走 → MLX / GGUF / llama.cpp がこれからも強い
- 製品アプリ・配布・安定稼働 →
.aimodel/ Core AI Framework が新標準に - 「どっちか」じゃなく、「フェーズで使い分ける」が開発者の新しいスキルになる
フォーマットの変化は、単なる拡張子の話じゃない。ローカルAIが「動くもの」から「アプリに安全に組み込める部品」へ変わる、開発文化の転換点——それが、WWDC 2026のいちばん大きな地殻変動なのかもしれません。
この問いは、実は『チカちゃんの哲学冒険譚』でも大事にしているテーマです。 「持つこと」と「在ること」——道具を所有する喜びと、道具に在ってもらう安心感のあいだ。 よかったら、そちらも覗いてみてくださいね。
🔗 NAND-DRAM時代シリーズ(全4本)
- 📖 #60: AFM 3 Core Advancedの技術設計——IFP・shared/routed experts・NAND-DRAM
- 🛠️ #61: Core AI Framework——SwiftアプリにQwenとSAM3を組み込むまで
- 💭 #62: NAND-DRAM時代の設計思想——全部を動かさなくても世界は回る
- 🔄 #63(この記事): MLXは終わらない、でも重心は変わる
参考URL
- Apple Developer「Meet Core AI」→ https://developer.apple.com/videos/play/wwdc2026/324/
- Apple Developer「Integrate on-device AI models into your app using Core AI」→ https://developer.apple.com/videos/play/wwdc2026/326/
- Apple GitHub: coreai-models → https://github.com/apple/coreai-models
- Apple GitHub: MLX → https://github.com/ml-explore/mlx
- Apple Developer: Background Assets → https://developer.apple.com/documentation/backgroundassets/
- インターネット上のツールは第三者が提供するものです。開発工程や配布経路を悪用した攻撃(サプライチェーン攻撃)が仕掛けられる可能性もゼロではありません。ご利用の際は公式リポジトリの情報をご確認いただき、自己責任でお使いください。
- AIに関する技術や情報は急速に変化します。本記事の内容が公開後に古くなる可能性があります。各サービスの公式ドキュメントや最新情報をご確認ください。