グーグル、最速・低コストな新AIモデル「Gemini 3.1 Flash-Lite」
Googleは3日(米国時間)、高速かつ低コストなGemini 3シリーズの最新AIモデル「Gemini 3.1 Flash-Lite」を発表した。大規模な開発者ワークロード向けに設計され、Google AI Studio内のGemini APIとVertex AI経由でプレビュー提供が開始された。
Gemini 3シリーズ最速で、最もコスト効率に優れたモデルとしており、入力トークン100万件あたり0.25ドル、出力トークン100万件あたり1.50ドルという低価格と高速な動作が特徴。大型モデルの数分の1のコストで、ベンチマークでは2.5 Flashを上回りながら、最初の回答トークンまでの時間が2.5倍高速化。出力速度も45%向上し、同等以上の品質を維持できているという。
こうした低遅延性は高頻度ワークフローに不可欠としており、Googleでは特に応答性の高いリアルタイム体験を構築するために適したモデルとしている。
Gemini 3.1 Flash-Lite delivers better performance at a fraction of the cost of larger models.
It outperforms 2.5 Flash with 2.5x faster (Time to First Answer Token) response times and a 45% increase in output speed.
Priced at just $0.25/1M input and $1.50/1M output tokens, it… pic.twitter.com/wc75wyOQre
— Google (@Google) March 3, 2026
3.1 Flash-LiteはArena.aiリーダーボードで1,432というEloスコアを達成し、推論およびマルチモーダル理解ベンチマークにおいて同クラスの他モデルを超えている。PQA Diamondで86.9%、MMMU Proで76.8%となり、2.5 Flashを含む前世代の大型Geminiモデルを上回る。
また、AI StudioとVertex AIでは「思考レベル」に対応し、開発者はタスクごとにモデルの思考量を調整できる。3.1 Flash-Liteは特にコスト優先の大規模タスクとして、高ボリューム翻訳、コンテンツモデレーションなどに対応できるほか、ユーザーインターフェースやダッシュボードの生成、シミュレーションの作成、指示の追従など、より深い推論が必要な複雑なワークロードにも対応可能としている。
Googleは3日(米国時間)、高速かつ低コストなGemini 3シリーズの最新AIモデル「Gemini 3.1 Flash-Lite」を発表した。大規模な開発者ワークロード向けに設計され、Google AI Studio内のGemini APIとVertex AI経由でプレビュー提供が開始された。 Gemini 3シリーズ最速で、最もコスト効率に優れたモデルとしており、入力トークン100万件あたり0.25ドル、出力トークン100万件あたり1.50ドルという低価格と高速な動作が特徴。大型モデルの数分の1のコストで、ベンチマークでは2.5 Flashを上回りながら、最初の回答トークンまでの時間が2.5倍高速化。出力速度も45%向上し、同等以上の品質を維持できているという。 こうした低遅延性は高頻度ワークフローに不可欠としており、Googleでは特に応答性の高いリアルタイム体験を構築するために適したモデルとしている。 Gemini 3.1 Flash-Lite delivers better performance at a fraction of the cost of larger models. It outperforms 2.5 Flash with 2.5x faster (Time to First Answer Token) response times and a 45% increase in output speed. Priced at just $0.25/1M input and $1.50/1M output tokens, it… pic.twitter.com/wc75wyOQre — Google (@Google) March 3, 2026 3.1 Flash-LiteはArena.aiリーダーボードで1,432というEloスコアを達成し、推論およびマルチモーダル理解ベンチマークにおいて同クラスの他モデルを超えている。PQA Diamondで86.9%、MMMU Proで76.8%となり、2.5 Flashを含む前世代の大型Geminiモデルを上回る。 また、AI StudioとVertex AIでは「思考レベル」に対応し、開発者はタスクごとにモデルの思考量を調整できる。3.1 Flash-Liteは特にコスト優先の大規模タスクとして、高ボリューム翻訳、コンテンツモデレーションなどに対応できるほか、ユーザーインターフェースやダッシュボードの生成、シミュレーションの作成、指示の追従など、より深い推論が必要な複雑なワークロードにも対応可能としている。
Googleは3日(米国時間)、高速かつ低コストなGemini 3シリーズの最新AIモデル「Gemini 3.1 Flash-Lite」を発表した。大規模な開発者ワークロード向けに設計され、Google AI Studio内のGemini APIとVertex AI経由でプレビュー提供が開始された。 Gemini 3シリーズ最速で、最もコスト効率に優れたモデルとしており、入力トークン100万件あたり0.25ドル、出力トークン100万件あたり1.50ドルという低価格と高速な動作が特徴。大型モデルの数分の1のコストで、ベンチマークでは2.5 Flashを上回りながら、最初の回答トークンまでの時間が2.5倍高速化。出力速度も45%向上し、同等以上の品質を維持できているという。 こうした低遅延性は高頻度ワークフローに不可欠としており、Googleでは特に応答性の高いリアルタイム体験を構築するために適したモデルとしている。 Gemini 3.1 Flash-Lite delivers better performance at a fraction of the cost of larger models. It outperforms 2.5 Flash with 2.5x faster (Time to First Answer Token) response times and a 45% increase in output speed. Priced at just $0.25/1M input and $1.50/1M output tokens, it… pic.twitter.com/wc75wyOQre — Google (@Google) March 3, 2026 3.1 Flash-LiteはArena.aiリーダーボードで1,432というEloスコアを達成し、推論およびマルチモーダル理解ベンチマークにおいて同クラスの他モデルを超えている。PQA Diamondで86.9%、MMMU Proで76.8%となり、2.5 Flashを含む前世代の大型Geminiモデルを上回る。 また、AI StudioとVertex AIでは「思考レベル」に対応し、開発者はタスクごとにモデルの思考量を調整できる。3.1 Flash-Liteは特にコスト優先の大規模タスクとして、高ボリューム翻訳、コンテンツモデレーションなどに対応できるほか、ユーザーインターフェースやダッシュボードの生成、シミュレーションの作成、指示の追従など、より深い推論が必要な複雑なワークロードにも対応可能としている。
Vocabulary
General
Proper noun
JLPT N2
JLPT N1
| # | 言葉 | 意味 |
|---|---|---|
| 6 | 対応 | たいおう (対応) : 1. correspondence (to); equivalence 2. suitability; coordination; matching; being appropriate (for) |
| 4 | 高速 | こうそく (高速) : 1. high-speed; rapid; express 2. highway; freeway; expressway; motorway |
| 4 | 大規模 | だいきぼ (大規模) : large-scale |
| 4 | 開発者 | かいはつしゃ (開発者) : developer |
| 4 | 件 | くだん (件) : 1. the aforementioned; the said; (man, incident, etc.) in question; the above-mentioned; the aforesaid 2. the usual |
| 4 | あたり | あたり (当たり) : 1. hit 2. success |
| 4 | 出力 | しゅつりょく (出力) : output (electrical, signal, etc.) |
| 4 | 大型 | おおがた (大型) : large; large-sized; large-scale; big |
| 4 | 上回る | うわまわる (上回る) : to exceed (esp. figures: profits, unemployment rate, etc.); to surpass; to be more than; to be better than |
| 4 | 推論 | すいろん (推論) : inference; deduction; induction; reasoning |
| 4 | 思考 | しこう (思考) : thought; consideration; thinking |
| 2 | 米国 | べいこく (米国) : (United States of) America; USA; US |
| 2 | 時間 | じかん (時間) : 1. time 2. hour |
| 2 | 低コスト | ていコスト (低コスト) : low cost |
| 2 | 最新 | さいしん (最新) : latest; newest; late-breaking (news) |
| 2 | 発表 | はっぴょう (発表) : announcement; publication; presenting; statement; communique; making known; breaking (news story); expressing (one's opinion); releasing; unveiling |
| 2 | 向け | むけ (向け) : intended for ...; oriented towards ...; aimed at ... |
| 2 | 設計 | せっけい (設計) : plan; design; layout |
| 2 | 経由 | けいゆ (経由) : going through; going via; going by way of |
| 2 | 提供 | ていきょう (提供) : 1. offer; tender; providing; supplying; making available; donating (blood, organs, etc.) 2. sponsoring (a TV program) |
| 2 | 開始 | かいし (開始) : start; commencement; beginning; initiation |
| 2 | 最速 | さいそく (最速) : fastest |
| 2 | 最も | もっとも (最も) : most; extremely |
| 2 | 効率 | こうりつ (効率) : efficiency |
| 2 | 優れる | すぐれる (優れる) : to surpass; to outstrip; to excel |
| 2 | 入力 | にゅうりょく (入力) : input; (data) entry |
| 2 | 低価格 | ていかかく (低価格) : low price |
| 2 | 動作 | どうさ (動作) : action; movements; motions; bearing; behaviour; behavior; execution; actuation; operation; manners |
| 2 | 特徴 | とくちょう (特徴) : feature; trait; characteristic; peculiarity; distinction |
| 2 | 回答 | かいとう (回答) : reply; answer |
| 2 | 高速化 | こうそくか (高速化) : increase in speed, acceleration |
| 2 | 速度 | そくど (速度) : 1. speed; velocity; pace; rate 2. velocity |
| 2 | 向上 | こうじょう (向上) : elevation; rise; improvement; advancement; progress |
| 2 | 同等 | どうとう (同等) : equality; equal; same rights; same rank; equivalence |
| 2 | 品質 | ひんしつ (品質) : quality (of a product or a service) |
| 2 | 維持 | いじ (維持) : maintenance; preservation; improvement |
| 2 | 低 | てい (低) : low (level, value, price, etc.) |
| 2 | 遅延 | ちえん (遅延) : delay; latency |
| 2 | 頻度 | ひんど (頻度) : frequency (of occurrence) |
| 2 | 不可欠 | ふかけつ (不可欠) : indispensable; essential |
| 2 | 応答 | おうとう (応答) : reply; answer; response |
| 2 | 体験 | たいけん (体験) : (practical) experience; personal experience; hands-on experience; first-hand experience |
| 2 | 構築 | こうちく (構築) : construction; building; putting up; erecting; creation; formulation; architecture (systems, agreement, etc.) |
| 2 | 適する | てきする (適する) : to fit; to suit |
| 2 | 達成 | たっせい (達成) : achievement; attainment; accomplishment; realization |
| 2 | および | および (及び) : and; as well as |
| 2 | 理解 | りかい (理解) : understanding; comprehension; appreciation; sympathy |
| 2 | 他 | ほか (他) : 1. other (place, thing, person); the rest 2. outside; beyond |
| 2 | 超える | こえる (越える) : 1. to cross over; to cross; to pass through; to pass over (out of); to go beyond; to go past 2. to exceed; to surpass; to be more (than) |
| 2 | 含む | ふくむ (含む) : 1. to contain; to comprise; to have; to hold; to include; to embrace 2. to hold in the mouth |
| 2 | 世代 | せだい (世代) : generation; the world; the age |
| 2 | ごと | ごと (毎) : each; every |
| 2 | 量 | りょう (量) : 1. quantity; amount; volume; capacity; portion (of food) 2. generosity; magnanimity; tolerance |
| 2 | 調整 | ちょうせい (調整) : adjustment; regulation; coordination; reconciliation; tuning; fixing; tailoring |
| 2 | 優先 | ゆうせん (優先) : preference; priority; precedence |
| 2 | 生成 | せいせい (生成) : creation; generation; formation; derivation |
| 2 | 作成 | さくせい (作成) : drawing up (e.g. legal document, contract, will, etc.); preparing; writing; framing; making; producing; creating; creation |
| 2 | 指示 | しじ (指示) : 1. indication; denotation; designation 2. instructions; directions |
| 2 | 追従 | ついじゅう (追従) : following (e.g. someone's opinion); being servile to; adherence; compliance; emulation; mimicking; servility |
| 2 | 可能 | かのう (可能) : possible; potential; practicable; feasible |