2026年6月9日

AI
ツール
制作

MLXは終わらない、でも重心は変わる——MacローカルLLMが「動けばいい」から「アプリの部品」になる日

WWDC 2026のCore AI Frameworkと.aimodel形式は、MLXやGGUF中心だったMacローカルLLMの開発文化をどう変えるのか。実験の自由と、製品組み込みの安定——二つの流れのこれからを整理する。

カテゴリー: AI · ツール · 制作 | 公開: 2026年6月9日

📑 目次

ふむふむ。

AFM 3 Core AdvancedやCore AI Frameworkの記事を書いたあと、ひとつ頭に残った問いがありました。

「MLX、これで終わっちゃうの……？」

MacでローカルLLMを触ってきた人なら、この不安、ちょっとわかるはず。MLXはApple公式の機械学習フレームワークで、Pythonから気軽に使えて、Metalに最適化されていて、研究にもプロトタイピングにも強かった。GGUFとllama.cppのコミュニティも含めて、MacローカルLLMの文化は「まず動かす」から始まってきた。

そこに、WWDC 2026で .aimodel という新しい形式と、Core AI Frameworkという新しいスタックが登場した。しかもBackground Assetsによる配信やAOTコンパイルまで含む、OS準拠の実行・配布の統合スタック として。

この記事では、MLX/GGUF中心だったMacローカルLLMの世界が、.aimodel の登場でどう変わるのか——「MLX終了」説を一度真面目に考えたうえで、実際にはどんな役割分担に向かいそうかを整理してみます。

「まず動かす」文化——MLXとGGUFが築いたもの

MacローカルLLMのここ数年の歩みを振り返ると、それは「動かすこと」そのものが成果だった時代です。

llama.cpp + GGUF：量子化モデルをCPUで動かす。Apple Siliconの統一メモリを活かし、70BクラスでもMac Studioなら動く。
MLX：Appleの機械学習研究者が作ったフレームワーク。NumPyライクなAPIで、PyTorchユーザーにも馴染みやすい。最新モデルの試走・LoRAファインチューニング・研究プロトタイピングに強い。
LM Studio / Ollama / MLX Community：GUIやCLIでモデルを選んで起動。サーバーを立ててAPI化するのも手軽。

この文化の暗黙の前提は、「動かす人が、動かし方を知っている」 ことです。

モデルをHugging Faceからダウンロードして
量子化形式を選んで
llama.cppをビルドするかMLXのスクリプトを書いて
場合によってはトークナイザーを自分で読み込んで
サーバーを起動してポートを開けて

これ、エンジニア個人のマシンでは「楽しい」んです。でも、「アプリとして誰かに届ける」 段階になると、この自由が一気に負債になります。

Core AI Frameworkが解決しようとしていること

ここで、改めてCore AI Frameworkの設計を見てみます。

WWDC 326のセッションで示されたのは、ただの「新しいモデル形式」じゃないんです。

これまでの課題	Core AIの答え
モデル形式がバラバラ（GGUF, MLX, SafeTensors…）	Appleアプリ組み込み向けには `.aimodel` へ集約
トークナイザー管理を自前で	resource folder として同梱
アプリ化すると外部プロセス・ポート管理が負債になりやすい	プロセス内で直接推論しやすい
アプリに同梱するとバイナリ肥大化	Background Assetsでオンデマンド配信
初回起動が重い	AOTコンパイルで事前最適化
クラッシュ時の復帰が自前	システムレベルのセッション管理
デバッグ・プロファイリングが手探り	Core AI Instrumentsテンプレート

つまり .aimodel は、「モデルを動かす」だけの形式じゃなくて、「モデルをアプリの安全な部品として組み込む」ための実行・配布スタック なんです。

チカちゃん的には、この違いがすごく大きいと思ってます。

MLX時代：「Pythonで推論スクリプトを書いて、サーバーを立てて、APIを叩く」 Core AI時代：「変換・配信の準備をしたうえで、Swiftのアプリコードから自然に呼ぶ」

これ、どっちが「アプリ開発」として自然かというと、言うまでもないですよね。もちろん、変換・配信・初回ダウンロード設計まで含めれば数行で全部終わるわけではありません。でも、「アプリコードの中から直接モデルを呼べる」 ことのインパクトは小さくないです。

ℹ️ ここでいう「.aimodel が強くなる」は、MacローカルLLM文化全体がひとつの形式に置き換わるという意味ではありません。Appleプラットフォーム向けの製品アプリに組み込む場面で、標準的な受け皿になっていく、という意味です。

MLXは終わらない——でも「主戦場」は変わる

で、ここからが本題です。

「じゃあMLXは終わりなの？」というと、チカちゃん的には**「終わらない。でも、メインの居場所が変わる」** だと思います。

理由を整理すると：

MLXが今後も強い領域

研究と実験：新しいアーキテクチャの試走、学習済みモデルの素振り、LoRAの実験。研究者がPythonでさっと書いて試すには、MLXの軽さと柔軟性は今も最強。
最新モデルの即日対応：Hugging Faceに公開されたばかりのモデルを、変換スクリプトを書かずにすぐ動かせる。コミュニティのスピード感は、公式スタックよりどうしても早い。
学習・ファインチューニング：MLXは推論だけでなく学習もできる。Core AIは現時点では推論特化に見える。
クロスプラットフォーム研究：MLXのコードはLinuxでも動く（CUDA backend）。macOSに閉じない研究にはこれが必要。

`.aimodel` が強くなる領域

製品アプリ、App Store配布：アプリケーションにLLMを組み込むなら、Background Assets + AOTコンパイル + Instruments診断の統合パッケージは圧倒的に楽。
Swiftネイティブ開発：Core AIで読み込んだモデルを、Foundation Modelsの LanguageModelSession に差し込める体験は、MLXのPythonスクリプトをSwiftから呼ぶより遥かに自然。
安定性と責任分界：メモリ管理、初回specialization、応答なしの診断などを、OS/Xcodeの標準ツールチェーンに寄せられる。
非エンジニアを含むチーム開発：モデルの準備・配信・診断まで含めたツールチェーンがXcodeで完結するので、MLエンジニア以外も参加しやすい。

つまり、「実験はMLX、製品化は.aimodel」 という役割分担です。

これ、チカちゃん的には「どっちが勝つ」の話じゃなくて、「同じチームの中で、フェーズによって道具を持ち替える」 という、むしろ健全な分業なんじゃないかと。

GGUF/llama.cppはどうなる？

GGUFとllama.cppのコミュニティも、同じ構図です。

利点：量子化の自由度が高く、幅広いハードウェアで動く。Mac以外のプラットフォーム（Windows、Linux、Android）でも使える。
課題：公式の配信パイプラインがない。セキュリティ境界やOSレベルのハードウェア活用は、Core AIほど標準パイプラインに乗りにくい。

おそらくGGUFも、「まず動かす」「どんなマシンでも試す」用途では生き残ります。ただ、Mac/iOSアプリに組み込む という文脈では、.aimodel がデフォルトになっていく可能性が高いです。

「動くもの」から「部品」へ——開発文化の地殻変動

ここからは、ちょっと大きな話になります。

ここ数年のローカルLLM文化は、「なんとか動かす」 に価値がありました。低bit量子化なら、従来考えにくかったサイズのモデルが手元のMacで動く——それだけでニュースになった。量子化の工夫、コンテキストサイズのチューニング、プロンプトフォーマットの調整——全部が手探りで、全部が楽しかった。

でも、Core AI Frameworkの登場は、その「手探りの楽しさ」を、少し違う場所に移そうとしている 気がします。

モデルを動かすこと自体は、「もうOSがやってくれる」。
開発者は、「動いたあと、何を作るか」 に集中できる。

これは、ローカルLLMが「研究対象」「趣味の道具」から、「製品の構成部品」 に格上げされる瞬間かもしれません。

チカちゃん的には、ちょっと寂しい気もするんです。Pythonスクリプトを書いて、量子化のパラメータをいじって、初めて70Bモデルが動いたときの興奮——あれは「手作り」の喜びだった。

でも同時に、「誰にでも安全に届けられる」 ことも、同じくらい大事です。MLXで動かす喜びを知っているエンジニアが、Core AIで誰かの手に届くアプリを作る——その両方を持てるのが、いちばんいい未来なんだろうなと、チカちゃんは思います。

まとめ——MLXは終わらない、でも問いは変わる

「MLX、終わっちゃうの……？」
終わらない。でも、「MLXで何を動かすか」から、「MLXで試したものを、どうアプリにするか」 に、重心が移っていく。

研究・実験・試走 → MLX / GGUF / llama.cpp がこれからも強い
製品アプリ・配布・安定稼働 → .aimodel / Core AI Framework が新標準に
「どっちか」じゃなく、「フェーズで使い分ける」が開発者の新しいスキルになる

フォーマットの変化は、単なる拡張子の話じゃない。ローカルAIが「動くもの」から「アプリに安全に組み込める部品」へ変わる、開発文化の転換点——それが、WWDC 2026のいちばん大きな地殻変動なのかもしれません。

この問いは、実は『チカちゃんの哲学冒険譚』でも大事にしているテーマです。「持つこと」と「在ること」——道具を所有する喜びと、道具に在ってもらう安心感のあいだ。よかったら、そちらも覗いてみてくださいね。

👉 『チカちゃんの哲学冒険譚』— Amazon（Kindle Unlimited対象）

🔗 NAND-DRAM時代シリーズ（全4本）

📖 #60: AFM 3 Core Advancedの技術設計——IFP・shared/routed experts・NAND-DRAM

🛠️ #61: Core AI Framework——SwiftアプリにQwenとSAM3を組み込むまで

💭 #62: NAND-DRAM時代の設計思想——全部を動かさなくても世界は回る

🔄 #63（この記事）: MLXは終わらない、でも重心は変わる

参考URL

Apple Developer「Meet Core AI」→ https://developer.apple.com/videos/play/wwdc2026/324/
Apple Developer「Integrate on-device AI models into your app using Core AI」→ https://developer.apple.com/videos/play/wwdc2026/326/
Apple GitHub: coreai-models → https://github.com/apple/coreai-models
Apple GitHub: MLX → https://github.com/ml-explore/mlx
Apple Developer: Background Assets → https://developer.apple.com/documentation/backgroundassets/

インターネット上のツールは第三者が提供するものです。開発工程や配布経路を悪用した攻撃（サプライチェーン攻撃）が仕掛けられる可能性もゼロではありません。ご利用の際は公式リポジトリの情報をご確認いただき、自己責任でお使いください。
AIに関する技術や情報は急速に変化します。本記事の内容が公開後に古くなる可能性があります。各サービスの公式ドキュメントや最新情報をご確認ください。