← Back

NTT、LLM間の"語彙の壁"克服 異種LLMを連携可能に

Source
NTTは、大規模言語モデル(LLM)における入出力単位「トークン」の語彙精度劣化なく縮小させ、異なるLLM間でもトークン語彙共通できる世界初推論技術を確立した。 LLMは文章を「トークン」という単位処理し、次に出力するトークンを確率的に予測しながら推論進めるただし、LLMごとに使うトークン語彙異なるのが一般的。この違いにより、モデル同士推論中の予測結果直接比較共有できない「語彙の壁」が生じている。その結果複数モデルの予測組み合わせるアンサンブルや、別モデルへ知識移すポータブルチューニングなど、異なるLLM間のトークンレベル連携が難しい状況だった。 今回の研究では、LLMが用いるトークン語彙を、精度落とさ柔軟縮小できる世界初の技術を確立推論中の次トークン予測を、指定した一部のトークンだけを候補とする形に変換できる。 独自理論基づく変換アルゴリズムにより、文章全体傾向保っまま任意部分語彙推論できるのが特長。これにより、語彙異なるLLM同士でも「最大共通語彙」を介し推論連携可能で、アンサンブルによる知識統合やポータブルチューニングによる知識転移実現できる。 実験では、異なる語彙を持つLLM同士でも性能維持したまま共通トークンで連携でき、さらに推論精度向上確認している。

NTTは、大規模言語モデル(LLM)における入出力単位「トークン」の語彙精度劣化なく縮小させ、異なるLLM間でもトークン語彙共通できる世界初推論技術を確立した。 LLMは文章を「トークン」という単位処理し、次に出力するトークンを確率的に予測しながら推論進めるただし、LLMごとに使うトークン語彙異なるのが一般的。この違いにより、モデル同士推論中の予測結果直接比較共有できない「語彙の壁」が生じている。その結果複数モデルの予測組み合わせるアンサンブルや、別モデルへ知識移すポータブルチューニングなど、異なるLLM間のトークンレベル連携が難しい状況だった。 今回の研究では、LLMが用いるトークン語彙を、精度落とさ柔軟縮小できる世界初の技術を確立推論中の次トークン予測を、指定した一部のトークンだけを候補とする形に変換できる。 独自理論基づく変換アルゴリズムにより、文章全体傾向保っまま任意部分語彙推論できるのが特長。これにより、語彙異なるLLM同士でも「最大共通語彙」を介し推論連携可能で、アンサンブルによる知識統合やポータブルチューニングによる知識転移実現できる。 実験では、異なる語彙を持つLLM同士でも性能維持したまま共通トークンで連携でき、さらに推論精度向上確認している。

Vocabulary

General Proper noun JLPT N2 JLPT N1
# 言葉 意味
18 語彙ごい (語彙) : vocabulary; lexicon; lexis; terminology
14 推論すいろん (推論) : inference; deduction; induction; reasoning
10 異なることなる (異なる) : to differ; to vary; to disagree
8 予測よそく (予測) : prediction; estimation
6 精度せいど (精度) : precision; accuracy
6 共通きょうつう (共通) : 1. common; shared; mutual 2. to be common (to); to be shared (by)
6 同士どうし (同士) : fellow; mutual; companion; comrade
6 知識ちしき (知識) : knowledge; information
6 連携れんけい (連携) : cooperation; coordination; link
4 単位たんい (単位) : 1. unit; denomination 2. credit (in school)
4 縮小しゅくしょう (縮小) : reduction; curtailment
4 世界初せかいはつ (世界初) : world-first
4 確立かくりつ (確立) : establishment; settlement
4 結果けっか (結果) : 1. result; consequence; outcome; effect 2. coming to fruition; bearing fruit
4 変換へんかん (変換) : 1. change; conversion; transformation 2. transformation
4 ままうば (乳母) : wet nurse; nursing mother
2 入出力にゅうしゅつりょく (入出力) : input and output; input-output; IO
2 劣化れっか (劣化) : 1. deterioration; degradation; drop in quality 2. becoming unattractive (because of aging)
2 か (化) : action of making something; -ification
2 処理しょり (処理) : processing; dealing with; treatment; disposition; disposal
2 出力しゅつりょく (出力) : output (electrical, signal, etc.)
2 確率かくりつ (確率) : probability; likelihood; chances
2 進めるすすめる (進める) : 1. to advance; to move forward; to put (a clock, watch) forward 2. to carry forward (plans, work, etc.); to proceed with; to make progress in; to further; to advance; to hasten; to speed up
2 ただしただし (但し) : but; however; provided that
2 ごとごと (毎) : each; every
2 一般的いっぱんてき (一般的) : general; popular; common; typical
2 違いちがい (違い) : 1. difference; distinction; discrepancy 2. mistake; error
2 直接ちょくせつ (直接) : direct; immediate; personal; firsthand
2 比較ひかく (比較) : comparison
2 共有きょうゆう (共有) : 1. joint ownership; co-ownership; sharing (e.g. a viewpoint) 2. sharing (files, devices on a network, posts on social media, etc.)
2 生ずるしょうずる (生ずる) : 1. to produce; to yield; to cause 2. to result from; to arise; to be generated
2 複数ふくすう (複数) : plural; multiple; several
2 組み合わせるくみあわせる (組み合わせる) : to join together; to combine; to join up
2 移すうつす (移す) : 1. to change; to swap; to substitute; to transfer 2. to change the object of one's interest or focus
2 状況じょうきょう (状況) : state of affairs (around you); situation; circumstances
2 用いるもちいる (用いる) : to use; to make use of; to utilize; to utilise
2 落とすおとす (落とす) : 1. to drop; to lose; to let fall; to shed (light); to cast (one's gaze); to pour in (liquid); to leave behind 2. to clean off (dirt, makeup, paint, etc.); to remove (e.g. stains or facial hair); to lose; to spend money at a certain place; to omit; to leave out; to secretly let escape
2 柔軟じゅうなん (柔軟) : flexible; lithe; soft; pliable
2 指定してい (指定) : designation; specification; assignment; appointment; pointing at
2 一部いちぶ (一部) : 1. one part; one portion; one section; some 2. one copy (e.g. of a document)
2 候補こうほ (候補) : 1. candidate; contender; prospect; pick; choice; list 2. candidacy; candidature; nomination
2 独自どくじ (独自) : 1. original; unique; distinctive; characteristic; peculiar 2. independent; one's own; personal
2 理論りろん (理論) : theory
2 基づくもとづく (基づく) : to be grounded on; to be based on; to be due to; to originate from
2 全体ぜんたい (全体) : whole; entirety; whatever (is the matter)
2 傾向けいこう (傾向) : tendency; trend; inclination
2 保つたもつ (保つ) : 1. to keep; to preserve; to hold; to retain; to maintain; to sustain 2. to last; to endure; to keep well (food); to wear well; to be durable
2 任意にんい (任意) : 1. optional; voluntary; arbitrary; random; discretionary; facultative; spontaneous; any 2. arbitrary
2 部分ぶぶん (部分) : portion; section; part
2 特長とくちょう (特長) : forte; merit
2 最大さいだい (最大) : biggest; greatest; largest; maximum
2 介するかいする (介する) : 1. to use as an intermediary 2. to worry; to mind; to care
2 可能かのう (可能) : possible; potential; practicable; feasible
2 統合とうごう (統合) : integration; unification; unity; combination; consolidation; synthesis
2 転移てんい (転移) : 1. moving (location, with the times, etc.); change; transition 2. metastasis; spread
2 実現じつげん (実現) : implementation (e.g. of a system); materialization; materialisation; realization; realisation; actualization; actualisation
2 実験じっけん (実験) : experiment
2 性能せいのう (性能) : ability; performance; efficiency
2 維持いじ (維持) : maintenance; preservation; improvement
2 向上こうじょう (向上) : elevation; rise; improvement; advancement; progress
2 確認かくにん (確認) : confirmation; verification; validation; review; check; affirmation; identification