それは謎から始まりました。
2026年2月6日、「Pony Alpha」というモデルがOpenRouterにひっそりと登場しました。出所の明記も発表もなく、完全に無料でした。開発者たちはすぐに、それが異例に高性能であることに気づきました。強力なコーディング、信頼性の高いツール呼び出し、スムーズなエージェント型ワークフロー。誰が作ったのか誰も知らないうちに、初日だけで400億を超えるトークンを処理し、206,000件のリクエストを集めました。
その5日後、Z.aiが答えを明かしました。Pony Alphaは、公式ローンチ前にステルスのライブテストとして稼働していた、同社の新しいフロンティアモデルGLM-5だったのです。OpenRouterにはこうした伝統があります。Quasar AlphaはGPT-4.1であることが判明し、Sherlock AlphaはGrok 4.1 Fastでした。Pony Alphaは、2026年が午年であることにちなんだ名前で、GLM-5が実際のユーザーによる現実世界の負荷テストを受けていたということです。
そのローンチからわずか1カ月余りで、Z.aiは次の一手を投入しました。2026年3月15日にリリースされたGLM-5 Turboです。これはOpenClawワークロード向けに特化して構築されています。このガイドでは、GLM-5 Turboとは何か、GLM-5とどう違うのか、そしてAutoClawとPony Alpha 2がどこに位置づけられるのかを解説します。
TL;DR — クイックリファレンス
モデル | リリース | コンテキスト | 最適な用途 |
GLM-5 | 2026年2月12日 | 202K | 複雑な推論、コーディング、システムエンジニアリング |
GLM-5 Turbo | 2026年3月15日 | 202K | 高スループットのOpenClawエージェントワークフロー |
Pony Alpha 2 | AutoClawに同梱 | 202K | ワンクリックのOpenClaw、エージェントタスク向けにファインチューニング |
GLM-5 Turboとは?
GLM-5 TurboはZ.aiによる特化型モデルバリアントで、2026年3月15日にリリースされました。Z.aiの公式リリースノートでは「高スループットのOpenClaw lobsterワークロード向けに設計」と説明されています。
この説明は単なるマーケティング文句ではなく、正確な技術的主張です。GLM-5が複雑なシステムエンジニアリングを対象とする汎用フロンティアモデルであるのに対し、GLM-5 Turboは特定の課題に焦点を当てています。継続的で大容量のワークフローを実行するOpenClawユーザーにとって、長いチェーンを持つエージェントタスク実行をより安定かつ効率的にすることです。
Z.aiの公式ドキュメントとBenchable.aiのモデルカードによると、GLM-5 Turboは長い実行チェーンを伴う現実世界のエージェントワークフロー向けに深く最適化されています。具体的な改善点は、複雑な指示分解の強化、ツールとスキル統合の改善、そして長時間のタスクにおける時間的な一貫性の向上です。つまり、複数ターン、複数ツールにまたがるシーケンスの中で、何が完了し、何が残っているかを追跡し続けます。
GLM-5 Turboは、OpenRouterで利用できます。料金は入力100万トークンあたり$0.96、出力100万トークンあたり$3.20で、ベースのGLM-5価格($0.72/$2.30)をやや上回ります。これはエージェント用途に特化した最適化を反映しています。
GLM-5とGLM-5 Turbo — 何が違うのか?
GLM-5はフラッグシップです。2026年2月12日にローンチされた744BパラメータのMixture-of-Expertsモデル(トークンあたり40Bがアクティブ)で、Z.aiのベンチマークとVentureBeatの報道によると、SWE-bench Verifiedで77.8%、AIME 2026で92.7%、GPQA-Diamondで86.0%を記録しました。Hugging FaceではMIT Licenseの下で公開されています。コーディング、推論、エージェント型タスク向けに強力で汎用的なオープンウェイトモデルを必要とする開発者には、GLM-5が選択肢になります。
GLM-5 Turboはエージェント特化型です。同じ202Kのコンテキストウィンドウと全体アーキテクチャを共有していますが、OpenClawワークロードが生み出すパターンに特化してチューニングされています。継続的な多段階実行、大量のツール呼び出し、スキルやサブエージェントをまたいだ長いコンテキストの蓄積です。この関係は次のように考えるとわかりやすいでしょう。GLM-5は総合力の高いマラソンランナーで、GLM-5 Turboは特定のトラックに最適化されたレーシングシューズを履いた同じランナーです。
GLM-5 | GLM-5 Turbo | |
リリース | 2026年2月12日 | 2026年3月15日 |
アーキテクチャ | 744B MoE、40B active | 同じベース |
コンテキスト | 202K | 202K |
API料金(OpenRouter) | $0.72 / $2.30 per M | $0.96 / $3.20 per M |
ライセンス | MIT(オープンウェイト) | APIのみ |
最適な用途 | 汎用推論、コーディング | OpenClawエージェントワークフロー |
ツール呼び出し最適化 | 強力 | さらに強化 |
ほとんどのOpenClawユーザーにとって、GLM-5 Turboが適切な選択です。エージェントワークフロー外で重い推論を必要とするタスク、つまり単体のコーディング、ドキュメント分析、リサーチでは、ベースのGLM-5の方が低コストで同等に機能します。
Pony Alphaのストーリー(そしてPony Alpha 2とは何か)
2026年2月6日、OpenRouterは「Pony Alpha」をラインナップに追加しました。出所の明記なし、コストゼロ、200Kコンテキストです。VentureBeatと、Hugging Faceで広く共有されたMaxime Labonneの分析によると、このモデルは初日に400億を超えるトークンを処理しました。コミュニティは、間接的なプロンプトに対してこのモデルがGLMシリーズのモデルだと自己認識することに気づきました。また、そのタイミングはZ.aiが事前に告知していた春節リリース期間と正確に一致していました。「Pony」というコードネームは意図的なヒントでした。2026年は午年であり、その名前はOpenRouterの謎のモデル公開の伝統(Quasar Alpha = GPT-4.1、Sherlock Alpha = Grok 4.1 Fast)に沿ったものです。
Pony Alphaはライブのストレステストでした。5日後にGLM-5が正式ローンチされた時点で、すでに何十万人もの実ユーザーによって、実際のワークロード全体で負荷テストを受けていたのです。
Pony Alpha 2は別物です。これは公開OpenRouterモデルではなく、ZhipuのデスクトップOpenClawクライアントであるAutoClawに同梱される独自モデルです。GLM-5アーキテクチャを基盤に、OpenClawのエージェント対話データに特化してファインチューニングされたPony Alpha 2は、エージェントフレームワーク向けの目的特化型AIに対するZhipuの投資を示しています。その結果、スキル定義の解釈から、適切にフォーマットされたツール呼び出しの生成、複雑な実行チェーンの管理まで、OpenClawフレームワーク内でネイティブに動作する方法を理解するモデルになっています。
AutoClaw — ZhipuのワンクリックOpenClawデスクトップアプリ
従来のOpenClawセットアップは、経験のある開発者でもおよそ30分かかります。リポジトリのクローン、依存関係のインストール、モデルキーの設定、スキルのダウンロード、環境変数の設定が必要です。AutoClawはこれを約1分に短縮します。
2026年3月にZhipu AIがローンチしたAutoClawは、WindowsとmacOS向けのワンクリックOpenClawインストーラーで、Yicai Globalは「中国初の『ワンクリックインストール』型ローカル版OpenClaw」と説明しています。コンテンツ作成、オフィス自動化、コード生成、マーケティング計画、財務分析をカバーする50以上のスキルがプリロードされています。
AutoClawはデフォルトモデルとしてPony Alpha 2を搭載していますが、DeepSeek、Moonshot AIのKimi、その他のプロバイダーを含む完全なオープンモデル統合にも対応しています。AutoGLMブラウザ自動化を統合しており、AIエージェントがWebページの移動、フォーム入力、データ抽出を自律的に行えるようにします。また、エンタープライズメッセージングワークフロー向けにFeishu(Lark)との深い統合も含まれています。
AutoClawは、現実の問題に対するZhipuの答えです。OpenClawは強力ですが、非技術者にとって使いやすいものではありません。オープンソースフレームワークの柔軟性はセットアップ負担を生み、多くの人を遠ざけています。AutoClawは基盤となる能力を維持したまま、その摩擦を取り除きます。
OpenClawでGLM-5 Turboを使う方法
方法は2つあります。AutoClaw(最も簡単)と、Z.ai API経由の手動設定です。
AutoClaw経由:
autoclaws.orgからAutoClawをダウンロードし、インストールしてログインします。GLM-5 Turbo(Pony Alpha 2経由)は、すでにデフォルトモデルとして設定されています。APIキーもターミナルコマンドも不要です。
実行:openclaw onboard --auth-choice zai-global
実行:openclaw models set zai/glm-5-turbo
Z.ai Coding Planユーザー向け:
実行:openclaw onboard --auth-choice zai-coding-global
OpenRouter経由:
実行:openclaw models providers add openrouter --base-url https://openrouter.ai/api/v1 --key YOUR_KEY
実行:openclaw models set openrouter/z-ai/glm-5-turbo
OpenClawの公式GLMプロバイダードキュメントによると、Z.aiプロバイダーは追加のアダプター設定なしでネイティブにサポートされています。すでにGLM-4.7 Flashをフォールバックとして使っている場合、GLM-5 Turboはプライマリとして自然に組み合わせられます。
実行:openclaw models set zai/glm-5-turbo
実行:openclaw models fallbacks add zai/glm-4.7-flash
このようなAIがビジネスにどう役立つか知りたいですか? Solveaは最新のAIを活用し、顧客からの電話、メール、チャットに24時間365日対応します。セットアップは不要です。 |
よくある質問
GLM-5 Turboとは何ですか?GLM-5とはどう違いますか?
GLM-5 TurboはGLM-5の特化型バリアントで、2026年3月15日にZ.aiによってリリースされ、高スループットのOpenClawエージェントワークフロー向けに最適化されています。ツール呼び出しの安定性強化、指示分解の改善、長時間タスクにおける一貫性向上が追加されています。OpenRouterでは、ベースのGLM-5よりわずかに高く、100万トークンあたり$0.96/$3.20です($0.72/$2.30に対して)。
AutoClawとPony Alpha 2とは何ですか?
AutoClawは、Zhipu AIによるWindowsおよびmacOS向けのワンクリックOpenClawデスクトップインストーラーで、50以上のプリインストール済みスキルと、デフォルトモデルとしてPony Alpha 2を同梱しています。Pony Alpha 2は、OpenClawのエージェントシナリオ向けに最適化された独自のGLM-5ファインチューニングモデルです。ツール呼び出しがより強力で、タスク分解に優れ、エラー率を低く抑えます。AutoClaw内でのみ提供され、単体のAPIモデルとしては利用できません。
OpenClawでGLM-5 Turboを使うにはどうすればよいですか?
最も簡単な方法はAutoClawです。ダウンロード、インストール、ログインを行えば、設定なしでGLM-5 Turboをすぐに使えます。手動設定の場合は、openclaw onboard --auth-choice zai-globalを実行してから、openclaw models set zai/glm-5-turboを実行します。OpenRouterでもz-ai/glm-5-turboとして利用できます。
AI受付を数分で稼働。
眠らないAIでフロントデスクを拡張しましょう。Solveaは複数チャネルの問い合わせに対応し、予約を自動でカレンダーに登録し、24時間機会損失を防ぎます。
結論
Z.aiはOpenClawユーザー向けに、GLM-5を中心とした一貫したストーリーを構築しています。強力なオープンウェイト基盤モデル(GLM-5)、目的特化型エージェントバリアント(GLM-5 Turbo)、デスクトップファーストにファインチューニングされたモデル(Pony Alpha 2)、そしてそれらすべてをパッケージ化する摩擦ゼロのインストーラー(AutoClaw)です。
GLMインフラストラクチャ上で実行したいOpenClawユーザーにとって、実践的な推奨は明快です。可能な限りシンプルなセットアップを望むならAutoClawを使ってください。モデル設定を直接コントロールしたいなら、Z.ai APIまたはOpenRouter経由でGLM-5 Turboを使ってください。高頻度タスク向けの軽量フォールバックとしてGLM-4.7 Flashと組み合わせるとよいでしょう。GLM-5 TurboのようなクラウドAPIを使うべきか、ローカルでモデルを動かすべきか迷っていますか?OpenClawに最適なローカルモデルに関する当社の解説では、ハードウェア要件とトレードオフを詳しく取り上げています。
Pony Alphaのストーリー、つまり誰もその名前を知らないうちに1日で400億トークンを処理したステルスモデルの話は、Z.aiのプロダクトローンチに対する考え方を物語っています。準備が整った時点で出荷したのです。その後、データがマーケティングを裏づけました。






