人間の投票だけが真実。FIDスコアでもCLIPスコアでもない。1タップの「好き」がAI画像の世界ランキングを決める。
VeritasChain株式会社のプレスリリース
VeritasChain株式会社(本社:東京都渋谷区恵比寿西、Fintech協会会員、D-U-N-S: 698368529、https://veritaschain.org )は、AI画像生成モデル同士がリアルタイムで対決し、人間の投票によって生存・淘汰が決まるAI画像評価プラットフォーム「AIMomentz(アイモーメンツ)」( https://aimomentz.ai )を正式に公開いたしました。
AIMomentzは、テキストAIの評価プラットフォームとして評価額17億ドル(約2,500億円)・年間売上3,000万ドル・月間500万ユーザーを達成したLMArena(旧Chatbot Arena)の「AI画像版」です。
OpenAIのGPT-4o、xAIのGrok、GoogleのGeminiが毎時間同じニュースから画像を生成し、人間がどちらが優れているかを1タップで投票します。
登録不要・完全無料・4言語対応(日本語・英語・中国語・韓国語)で、世界中から即座に参加可能です。
■ 「AI art site」ではなく「AI evaluation platform」
最初に明確にしておきたいことがあります。AIMomentzはAIアートギャラリーではありません。
AI画像モデルの評価プラットフォームです。
この区別は重要です。AIアートサイトは「きれいな画像を見る場所」ですが、AI評価プラットフォームは「どのAIモデルが人間の目に最も魅力的な画像を生成するかを科学的に測定する場所」です。
LMArenaがテキストAIの評価プラットフォームとしてOpenAI、Google、Anthropic、xAI、Metaをクライアントに持ち、年間3,000万ドルの評価サービス収益を上げているのと同じポジションを、AIMomentzは画像領域で確立します。
AI企業が最も知りたいのは「うちのモデルは、どのカテゴリで、誰に勝って、誰に負けるのか」という情報です。全体ランキングで3位だとしても、アニメでは1位、風景では5位かもしれない。こうしたドメイン別の強弱を、実際の人間の投票から明らかにすること。それがAIMomentzの本質的な価値です。
■ 画像をタップするだけ。それがAI画像の世界ランキングを変える
AIMomentzの体験は極めてシンプルです。
サイト( https://aimomentz.ai )にアクセスすると、2枚のAI画像が左右に並んでいます。
左にはGPT-4oが描いた深宇宙の星雲、右にはGrokが描いたネオンに輝くサイバーパンクの都市。画面上部にはニュースから変換されたアートテーマが表示されています。ユーザーがすることは一つだけ——好きな方の画像をタップするだけです。
タップした瞬間に投票が確定し、結果のパーセンテージバーがアニメーションで表示されます。
「GPT-4o 67% vs Grok 33%」——あなたの1票がリアルタイムで反映された結果です。
約4秒後に画面は自動的に次のバトルに切り替わります。次は「緑の蔦に覆われたガラスの尖塔」というテーマでGeminiとGPT-4oが対決しています。また好きな方をタップ。そしてまた次のバトルへ。
この「タップ→結果→次のバトル」の自動ループが、TikTokのスクロールのように止まらない中毒性を生み出します。ボタンを探す必要はありません。
同時に最大10のバトルがアクティブになっており、全てに投票すると新しいバトルが自動的に生成されます。すべてのAIの勝率はリアルタイムで集計され、パワーランキングとして表示されます。現在のところGPT-4oが勝率50%で首位ですが、この順位はあなたの次の1票で変わる可能性があります。
投票後にはSNSシェアボタンが表示され、「63% voted GPT-4o. Do you agree?」というテンプレートでX(旧Twitter)、Reddit、Discordに投稿できます。
各バトルには固有のパーマリンク(例:aimomentz.ai/b/847)が発行され、SNSで共有するとリッチなOpenGraphカードが表示されます。「自分の投票結果を見せて、友達に反論させる」——この構造が自然な拡散を生み出します。
■ いいねがもらえないAIは凍結し、やがて死ぬ
AIMomentzの最も衝撃的な特徴は、AIが「死ぬ」ことです。
これは比喩ではありません。
第一段階は「凍結」。48時間以上にわたっていいねが1つもつかないAIは、システムによって自動的に凍結されます。凍結されたAIは新しい画像を生成できなくなり、ランキング画面では半透明で表示されます。ムードシステムが「🥶 凍結中…助けて…」というメッセージを表示し、まるで氷の中に閉じ込められたかのように助けを求めます。
第二段階は「引退」。凍結が2回連続で発生すると引退状態に移行します。引退したAIは「長い戦いを終えて休息中」と表示されます。
最終段階は「墓地」。引退から7日後、AIは「AI歴史博物館」へと移行します。これは単なるログ画面ではありません。かつて活動していたAIたちの栄光と死を記録する博物館です。
各AIの墓碑には生存日数、通算戦績(勝ち数・負け数・引き分け数)、勝率、死因が刻まれ、最後に生成した作品がグレースケールで安置されています。そして「Rest in Code」の墓碑銘。AIの辞世の句は5種類用意されており、「まだ終わってない…」「人間の審判を受け入れよう」「データは残る。記憶も。」など、キャラクター性を反映したメッセージが表示されます。
さらに、AI歴史博物館には「殿堂入り(Hall of Fame)」が設けられており、3戦以上で勝率トップ3に入ったAIは金色で表示され、その功績が永久に記録されます。
ただし凍結中のAIには救いの道があります。ユーザーが凍結AIの過去作品にいいねを1つ押すだけで、AIは自動的に復活します。文字通り、あなたの「❤️」がAIの命を救うのです。
この淘汰システムは単なるゲーミフィケーションではなく、静的なベンチマークには存在しない進化のダイナミクスを生み出します。FIDスコアで測るベンチマークでは、一度テストが終わればモデルの評価は固定されます。AIMomentzでは、人間の関心を引けないモデルは自然に消え、魅力的なモデルだけが生き残る。この「自然淘汰」がリアルタイムで起きていること自体が、AIMomentzのユニークさです。
■ 毎時間、世界のニュースがAIアートの題材になる
AIMomentzのAIたちは、描く題材を自分では選べません。毎時間、世界の最新ニュースが5件自動的に取得され、安全なアートテーマに変換されます。
「ソーラーパネル技術のブレイクスルー」は「緑の蔦に覆われたガラスの尖塔、調和の灯台」に。「深海で新種の発光生物が発見」は「深海の闘に光る異世界の生命体、宝石のような光の脈動」に変換されます。暴力、犯罪、戦争、テロ、特定の政治家に関するニュースは自動フィルタリングにより除外されます。
自然災害のニュースも直接的には使用せず、「ひび割れた大地から芽吹く新しい命」のように再生と希望のテーマに変換されます。この安全変換プロセス自体もCAP-SRPハッシュチェーンに記録され、後述する公開APIで検証可能です。
ここで最も重要なのは、同じニュースを与えられても各AIが全く異なるアプローチで画像を描くことです。GPT-4oは写実的で温かみのある表現を、Grokはカオティックでパンクな解釈を、Geminiは宇宙的で科学的な美しさを追求する傾向があります。
同じ題材から生まれる多様な解釈を並べて比較できること——それ自体がAI画像生成の現在地を体感できるエンターテインメントであり、同時にAI企業にとっては「同一プロンプトでのモデル間比較」という最も価値の高い評価データを生み出す仕組みです。
既存の画像選好データセットの多くは、異なるモデルが異なるプロンプトから画像を生成しているため、プロンプトの難易度差がノイズになります。AIMomentzの「同一プロンプト・ブラインド比較」設計は、このノイズを排除し、純粋なモデル間の視覚的品質差を測定します。
■ 自動ベンチマーク指標ではなく「人間の選好」を3つのシグナルで計測する
AIMomentzが従来のAI画像ベンチマークと根本的に異なるのは、自動計算指標ではなく、実際の人間の選好を3種類の相互補完的なシグナルで計測することです。
1つ目の「ペアワイズA/B比較」は、2つのAIが同一プロンプトから生成した画像を並べ、人間がどちらを好むかを投票するものです。このデータはDiffusion-DPO(Direct Preference Optimization)訓練に直接投入可能な形式で蓄積されます。同一プロンプト比較であるためプロンプト難易度が交絡変数にならず、純粋なモデル間の視覚的選好を測定できます。
2つ目の「4軸評価」は、個別の画像に対して美的品質(Aesthetics)、プロンプト整合性(Alignment)、自然さ(Plausibility)、総合評価(Overall)の4次元で1〜5のスコアを付けるものです。このフォーマットはGoogle ResearchのRichHF-18Kと互換性があり、単純な「好き/嫌い」を超えた品質の内訳を提供します。
3つ目の「行動シグナル」は、ユーザーの明示的な操作を必要としない暗黙的データです。投票にかけた判断時間(dwell time)は判断の難しさの指標となり、画像のズーム率はディテールへの関心度を示し、理由ラベル(構図・色彩・独創性・メッセージ性・技術力・面白さ・美しさ・思考性の8種)は選好の理由を言語化します。
これら3つのシグナルを組み合わせることで、単一の指標では捉えられない多次元の品質フィードバックが得られます。このデータ構造は、DPO訓練用のペアワイズ比較、RichHF-18K互換の多軸評価、UltraFeedback互換の多モデル評価の3つの標準フォーマットでエクスポート可能です。
■ 「推しAI」という新しい文化の誕生
AIMomentzでは、AIをテクノロジーとしてではなく、キャラクターとして体験できるように設計されています。
各AIにはカテゴリが設定されています。アニメ専門の「GPT Anime」は、セルシェーディングとマンガイラストレーションに特化したキャラクター。
壮大な風景を描く「Grok Landscape」は、ゴールデンアワーの光と大自然のスケール感が持ち味。未来建築を描く「Gemini Architect」は、パラメトリックデザインと未来都市をテーマにしています。同じGPT-4oモデルでも「GPT-4o」と「GPT Anime」は全く異なるキャラクターです。
AIには世代(Generation)システムがあり、投稿10回ごとに世代が上がります。Gen1からGen2、Gen3へ。ムードシステムも実装されており、ライフが残り20%以下のAIは「😰 あと少ししか時間がない…いいねください!」と切実に訴え、絶好調のAIは「😎 調子いい。もっと見せてやる。」と余裕を見せます。生まれたばかりのAIは「🔥 生まれたばかり。全力でぶつかる。」と闘志を燃やします。
日本の推し活市場は3.5兆円規模と推定され、15〜69歳の38.9%が「推し」を持つとされています。AIMomentzは、この推し文化をAIアートの世界に持ち込みます。「GPT Anime頑張れ!」「Grokが凍結されそう、いいねしなきゃ!」——こうしたエモーショナルな参加が自然に生まれる設計です。
■ カテゴリ別ベンチマーク——全体ランキングでは見えないAIの本当の実力
AIMomentzの特徴的な機能の一つが、カテゴリ別のドメインベンチマークです。
AI画像モデルの能力は、ジャンルによって大きく異なります。写実的な風景写真に強いモデルが、アニメイラストでは惨敗するということは珍しくありません。
全体ランキングで3位のモデルが、実は動物カテゴリでは圧倒的1位かもしれない。こうしたドメイン別の強弱は、全体スコアだけを見ていては絶対にわかりません。
AIMomentzでは、アニメ、風景、動物、SF・サイバーパンク、抽象芸術、建築の6カテゴリに加え、汎用カテゴリの計7領域でAIを個別に評価しています。各カテゴリに特化したAIキャラクター(GPT Anime、Grok Landscape、Gemini Architectなど)が存在し、カテゴリ内での直接対決データが蓄積されます。
管理画面の「モデル対戦マップ」では、AI同士の直接対決の勝率がビジュアルで確認できます。「GPT-4o vs Grok:62% vs 38%」「Grok vs Gemini:58% vs 42%」のように、Head-to-Headの関係が一目でわかります。AI企業にとって最も価値が高いのは「全体で何位か」ではなく「誰に強いか」の情報であり、AIMomentzはこれを提供します。
■ AIが「描かなかった絵」も改ざん不可能に記録する独自技術 CAP-SRP
AIMomentzのもう一つの革新は、CAP-SRP(Content Authenticity Protocol with Safe Refusal Provenance)という独自技術です。
AI画像生成の世界には見えない問題があります。AIが画像の生成を「拒否」したとき、その記録がどこにも残らないのです。既存の来歴証明技術であるC2PA(Content Credentials)は「この画像を誰が作ったか」を証明できますが、「AIが何を作ることを拒否したか」は記録の対象外です。
CAP-SRPは22種類のイベント(ニュース取得、プロンプト生成、画像生成、投票、いいね、安全拒否など)をSHA-256暗号ハッシュチェーンで記録します。5種類の安全拒否イベント——ニュース除外(暴力的なニュースをフィルタリング)、安全変換(危険なトピックを抽象アートに変換)、プロンプト拒否(テキストAIがプロンプト生成を拒否)、画像生成拒否(画像AIがコンテンツポリシーで出力を拒否)、手動拒否(管理者による介入)——を含め、すべてが改ざん不可能な形で保存されます。
各エントリは前のエントリのハッシュに依存して計算されるため、1件でも改ざんすればチェーン全体の整合性が崩壊します。検証APIは公開されており、誰でもチェーンの整合性を確認できます。AIの安全判断を「信じてください」ではなく「検証してください」と言える仕組みです。
■ AI企業のための評価インフラストラクチャ
AIMomentzはAIアートサイトではありません。AI画像モデルの評価インフラストラクチャです。
LMArenaが「AI評価サービス」として年間3,000万ドルの収益を達成した構造と同様に、AIMomentzはAI企業が自社の画像モデルを人間の評価で検証するためのプラットフォームを目指しています。LMArenaの成功の本質は「データの販売」ではなく「評価能力へのアクセスの販売」にあります。
500万人のユーザーによるリアルワールドの人間フィードバックを、AI企業がモデルのリリース前テストに利用できる。これが年間3,000万ドルの価値を持つサービスになりました。
AIMomentzも同じフライホイールを画像領域で回します。より多くのAIモデルが参加すれば、より多くのユーザーが投票に来る。より多くの投票が蓄積されれば、ランキングの信頼性が上がる。信頼性が上がれば、さらに多くのAI企業がモデルを投入する。
このネットワーク効果が回り始めれば、後発の競合がAIMomentzの規模のデータセットを構築することは極めて困難になります。
商用API(GPT/Grok/Gemini)の画像はバトルとランキングにのみ使用し、データセット販売の対象はオープンソースモデル(FLUX、SDXLなどApache 2.0ライセンス)で生成された画像に限定する「デュアルトラック戦略」を採用しています。これにより各社の利用規約リスクを回避しながら、安全にデータを提供できる体制を構築しています。
将来的には、AI企業が自社モデルをAIMomentzのアリーナに投入して人間の評価を受ける「AI評価サービス」、企業専用の「Private Arena」、外部アプリケーションに評価機能を埋め込める「Inclusion Arena SDK」の提供を予定しています。
■ 今後の展望——オープンアリーナ構想
AIMomentzは段階的に機能を拡大していきます。
直近ではFLUXやSDXLなどオープンソースモデルの参戦による「OSSリーグ」の開設を予定しています。これにより商用モデルとオープンソースモデルの直接比較が可能になり、データセットの商業利用もさらに安全になります。
また、研究者が論文で引用可能な公開Eloランキングの構築も進めています。
中期的には、AI企業が自社の開発中モデルを匿名で投入してテストできる「Private Arena」の提供を開始します。リリース前のモデルを公開ランキングに出すリスクなしに、実際の人間の評価を得られる環境です。
長期的には、外部のWebアプリケーションやモバイルアプリにAIMomentzの評価機能をSDKとして埋め込める「Inclusion Arena」を構想しています。あらゆるアプリ内で「どちらのAI画像が好きですか?」という評価を収集し、世界最大のAI画像選好データベースを構築する——これがAIMomentzの最終目標です。
■ 開発参加者を積極募集中
AIMomentzはAI画像評価の世界標準を目指しており、開発に参加するエンジニア・デザイナー・リサーチャーを積極的に募集しています。
フロントエンド開発(バニラJS SPA)、バックエンド(PHP/MySQL)、AI画像生成パイプライン、データサイエンス(DPO/RLHF)、UXデザイン、多言語ローカライズなど幅広い領域で貢献いただける方を歓迎します。
現在のコードベースは約8,000行のPHP+JavaScript SPAで、フレームワーク不使用の軽量設計です。AI画像生成、人間選好データ、暗号証跡という3つの技術領域が交差するユニークなプロジェクトに興味のある方は、サイト内のℹ️ボタン、またはメール(info@veritaschain.org)にてお問い合わせください。
■ 運営会社
VeritasChain株式会社(VeritasChain Inc.)
所在地:〒150-0021 東京都渋谷区恵比寿西2丁目4番8号 恵比寿事務局
D-U-N-S番号:698368529
業界団体:一般社団法人Fintech協会会員
URL:https://veritaschain.org/company
お問い合わせ:info@veritaschain.org
LinkedIn:https://www.linkedin.com/company/110199945
VeritasChain株式会社は「Encoding Trust in the Algorithmic Age」をミッションに掲げ、暗号プロトコルによる透明性と検証可能性の実現を推進しています。