NTT、LLM間の"語彙の壁"克服 異種LLMを連携可能に
NTTは、大規模言語モデル(LLM)における入出力単位「トークン」の語彙を精度劣化なく縮小させ、異なるLLM間でもトークン語彙を共通化できる世界初の推論技術を確立した。
LLMは文章を「トークン」という単位で処理し、次に出力するトークンを確率的に予測しながら推論を進める。ただし、LLMごとに使うトークン語彙は異なるのが一般的。この違いにより、モデル同士で推論中の予測結果を直接比較・共有できない「語彙の壁」が生じている。その結果、複数モデルの予測を組み合わせるアンサンブルや、別モデルへ知識を移すポータブルチューニングなど、異なるLLM間のトークンレベル連携が難しい状況だった。
今回の研究では、LLMが用いるトークン語彙を、精度を落とさず柔軟に縮小できる世界初の技術を確立。推論中の次トークン予測を、指定した一部のトークンだけを候補とする形に変換できる。
独自の理論に基づく変換アルゴリズムにより、文章全体の傾向を保ったまま、任意の部分語彙で推論できるのが特長。これにより、語彙の異なるLLM同士でも「最大共通語彙」を介した推論時連携が可能で、アンサンブルによる知識統合やポータブルチューニングによる知識転移を実現できる。
実験では、異なる語彙を持つLLM同士でも性能を維持したまま共通トークンで連携でき、さらに推論精度の向上も確認している。
NTTは、大規模言語モデル(LLM)における入出力単位「トークン」の語彙を精度劣化なく縮小させ、異なるLLM間でもトークン語彙を共通化できる世界初の推論技術を確立した。 LLMは文章を「トークン」という単位で処理し、次に出力するトークンを確率的に予測しながら推論を進める。ただし、LLMごとに使うトークン語彙は異なるのが一般的。この違いにより、モデル同士で推論中の予測結果を直接比較・共有できない「語彙の壁」が生じている。その結果、複数モデルの予測を組み合わせるアンサンブルや、別モデルへ知識を移すポータブルチューニングなど、異なるLLM間のトークンレベル連携が難しい状況だった。 今回の研究では、LLMが用いるトークン語彙を、精度を落とさず柔軟に縮小できる世界初の技術を確立。推論中の次トークン予測を、指定した一部のトークンだけを候補とする形に変換できる。 独自の理論に基づく変換アルゴリズムにより、文章全体の傾向を保ったまま、任意の部分語彙で推論できるのが特長。これにより、語彙の異なるLLM同士でも「最大共通語彙」を介した推論時連携が可能で、アンサンブルによる知識統合やポータブルチューニングによる知識転移を実現できる。 実験では、異なる語彙を持つLLM同士でも性能を維持したまま共通トークンで連携でき、さらに推論精度の向上も確認している。
NTTは、大規模言語モデル(LLM)における入出力単位「トークン」の語彙を精度劣化なく縮小させ、異なるLLM間でもトークン語彙を共通化できる世界初の推論技術を確立した。 LLMは文章を「トークン」という単位で処理し、次に出力するトークンを確率的に予測しながら推論を進める。ただし、LLMごとに使うトークン語彙は異なるのが一般的。この違いにより、モデル同士で推論中の予測結果を直接比較・共有できない「語彙の壁」が生じている。その結果、複数モデルの予測を組み合わせるアンサンブルや、別モデルへ知識を移すポータブルチューニングなど、異なるLLM間のトークンレベル連携が難しい状況だった。 今回の研究では、LLMが用いるトークン語彙を、精度を落とさず柔軟に縮小できる世界初の技術を確立。推論中の次トークン予測を、指定した一部のトークンだけを候補とする形に変換できる。 独自の理論に基づく変換アルゴリズムにより、文章全体の傾向を保ったまま、任意の部分語彙で推論できるのが特長。これにより、語彙の異なるLLM同士でも「最大共通語彙」を介した推論時連携が可能で、アンサンブルによる知識統合やポータブルチューニングによる知識転移を実現できる。 実験では、異なる語彙を持つLLM同士でも性能を維持したまま共通トークンで連携でき、さらに推論精度の向上も確認している。
Vocabulary
General
Proper noun
JLPT N2
JLPT N1
| # | 言葉 | 意味 |
|---|---|---|
| 18 | 語彙 | ごい (語彙) : vocabulary; lexicon; lexis; terminology |
| 14 | 推論 | すいろん (推論) : inference; deduction; induction; reasoning |
| 10 | 異なる | ことなる (異なる) : to differ; to vary; to disagree |
| 8 | 予測 | よそく (予測) : prediction; estimation |
| 6 | 精度 | せいど (精度) : precision; accuracy |
| 6 | 共通 | きょうつう (共通) : 1. common; shared; mutual 2. to be common (to); to be shared (by) |
| 6 | 同士 | どうし (同士) : fellow; mutual; companion; comrade |
| 6 | 知識 | ちしき (知識) : knowledge; information |
| 6 | 連携 | れんけい (連携) : cooperation; coordination; link |
| 4 | 単位 | たんい (単位) : 1. unit; denomination 2. credit (in school) |
| 4 | 縮小 | しゅくしょう (縮小) : reduction; curtailment |
| 4 | 世界初 | せかいはつ (世界初) : world-first |
| 4 | 確立 | かくりつ (確立) : establishment; settlement |
| 4 | 結果 | けっか (結果) : 1. result; consequence; outcome; effect 2. coming to fruition; bearing fruit |
| 4 | 変換 | へんかん (変換) : 1. change; conversion; transformation 2. transformation |
| 4 | まま | うば (乳母) : wet nurse; nursing mother |
| 2 | 入出力 | にゅうしゅつりょく (入出力) : input and output; input-output; IO |
| 2 | 劣化 | れっか (劣化) : 1. deterioration; degradation; drop in quality 2. becoming unattractive (because of aging) |
| 2 | 化 | か (化) : action of making something; -ification |
| 2 | 処理 | しょり (処理) : processing; dealing with; treatment; disposition; disposal |
| 2 | 出力 | しゅつりょく (出力) : output (electrical, signal, etc.) |
| 2 | 確率 | かくりつ (確率) : probability; likelihood; chances |
| 2 | 進める | すすめる (進める) : 1. to advance; to move forward; to put (a clock, watch) forward 2. to carry forward (plans, work, etc.); to proceed with; to make progress in; to further; to advance; to hasten; to speed up |
| 2 | ただし | ただし (但し) : but; however; provided that |
| 2 | ごと | ごと (毎) : each; every |
| 2 | 一般的 | いっぱんてき (一般的) : general; popular; common; typical |
| 2 | 違い | ちがい (違い) : 1. difference; distinction; discrepancy 2. mistake; error |
| 2 | 直接 | ちょくせつ (直接) : direct; immediate; personal; firsthand |
| 2 | 比較 | ひかく (比較) : comparison |
| 2 | 共有 | きょうゆう (共有) : 1. joint ownership; co-ownership; sharing (e.g. a viewpoint) 2. sharing (files, devices on a network, posts on social media, etc.) |
| 2 | 生ずる | しょうずる (生ずる) : 1. to produce; to yield; to cause 2. to result from; to arise; to be generated |
| 2 | 複数 | ふくすう (複数) : plural; multiple; several |
| 2 | 組み合わせる | くみあわせる (組み合わせる) : to join together; to combine; to join up |
| 2 | 移す | うつす (移す) : 1. to change; to swap; to substitute; to transfer 2. to change the object of one's interest or focus |
| 2 | 状況 | じょうきょう (状況) : state of affairs (around you); situation; circumstances |
| 2 | 用いる | もちいる (用いる) : to use; to make use of; to utilize; to utilise |
| 2 | 落とす | おとす (落とす) : 1. to drop; to lose; to let fall; to shed (light); to cast (one's gaze); to pour in (liquid); to leave behind 2. to clean off (dirt, makeup, paint, etc.); to remove (e.g. stains or facial hair); to lose; to spend money at a certain place; to omit; to leave out; to secretly let escape |
| 2 | 柔軟 | じゅうなん (柔軟) : flexible; lithe; soft; pliable |
| 2 | 指定 | してい (指定) : designation; specification; assignment; appointment; pointing at |
| 2 | 一部 | いちぶ (一部) : 1. one part; one portion; one section; some 2. one copy (e.g. of a document) |
| 2 | 候補 | こうほ (候補) : 1. candidate; contender; prospect; pick; choice; list 2. candidacy; candidature; nomination |
| 2 | 独自 | どくじ (独自) : 1. original; unique; distinctive; characteristic; peculiar 2. independent; one's own; personal |
| 2 | 理論 | りろん (理論) : theory |
| 2 | 基づく | もとづく (基づく) : to be grounded on; to be based on; to be due to; to originate from |
| 2 | 全体 | ぜんたい (全体) : whole; entirety; whatever (is the matter) |
| 2 | 傾向 | けいこう (傾向) : tendency; trend; inclination |
| 2 | 保つ | たもつ (保つ) : 1. to keep; to preserve; to hold; to retain; to maintain; to sustain 2. to last; to endure; to keep well (food); to wear well; to be durable |
| 2 | 任意 | にんい (任意) : 1. optional; voluntary; arbitrary; random; discretionary; facultative; spontaneous; any 2. arbitrary |
| 2 | 部分 | ぶぶん (部分) : portion; section; part |
| 2 | 特長 | とくちょう (特長) : forte; merit |
| 2 | 最大 | さいだい (最大) : biggest; greatest; largest; maximum |
| 2 | 介する | かいする (介する) : 1. to use as an intermediary 2. to worry; to mind; to care |
| 2 | 可能 | かのう (可能) : possible; potential; practicable; feasible |
| 2 | 統合 | とうごう (統合) : integration; unification; unity; combination; consolidation; synthesis |
| 2 | 転移 | てんい (転移) : 1. moving (location, with the times, etc.); change; transition 2. metastasis; spread |
| 2 | 実現 | じつげん (実現) : implementation (e.g. of a system); materialization; materialisation; realization; realisation; actualization; actualisation |
| 2 | 実験 | じっけん (実験) : experiment |
| 2 | 性能 | せいのう (性能) : ability; performance; efficiency |
| 2 | 維持 | いじ (維持) : maintenance; preservation; improvement |
| 2 | 向上 | こうじょう (向上) : elevation; rise; improvement; advancement; progress |
| 2 | 確認 | かくにん (確認) : confirmation; verification; validation; review; check; affirmation; identification |