4月 01 2024 0 低パラメータLLMsのエージェント能力向上に関する論文解説 投稿者: ユウ 解説 ねえ智也、この論文のタイトル見て興味深いんだけど、内容教えてくれる?「低パラメータLLMsの一般エージェント能力を向上させるためのチューニングと多分岐推論」って何? うん、この論文はね、オープンソースの大規模言語モ…
4月 01 2024 0 PURPLE: SQLライティングを改善する大規模言語モデル 投稿者: ユウ 要点 PURPLEは、自然言語からSQLへの翻訳を改善するための新しい手法です。 既存の大規模言語モデル(LLM)は、特定のNL2SQLタスクに特化したチューニングなしに、基本的なSQL生成能力を持っています。 PURP…
4月 01 2024 0 計算上の意識構造に基づく生成エージェントについて 投稿者: ユウ 要点 大規模言語モデル(LLM)は、暗黙の指示を理解し、常識知識を適用するタスクで課題に直面しています。 この論文では、計算上の意識構造である内部時間意識マシン(ITCM)を紹介します。 ITCMに基づくエージェント(I…
4月 01 2024 0 AI生成テキストの検出におけるプロンプトの影響 投稿者: ユウ 要点 大規模言語モデル(LLM)の発展により、実用的な応用が広がっている。 LLMを使った偽ニュースの生成や盗作などの悪用が問題視されている。 AI生成テキストか人間が生成したテキストかを評価するディテクターが開発されて…
4月 01 2024 0 ChatGPTとメディアバイアスの検出能力 投稿者: ユウ 要点 ChatGPTとメディアバイアスの検出能力に関する比較研究。 ChatGPTは、ヘイトスピーチとテキストレベルのコンテキストバイアスの検出で、ファインチューニングされたモデルと同等の性能を示した。 しかし、フェイク…
4月 01 2024 0 デマの未来?検索、識別、生成についての解説 投稿者: ユウ 要点 人工知能によるコンテンツ生成技術の発展は、社会的、経済的、政治的なエコシステムに影響を与えるデマの作成を容易にしている。 現在のデマ検出の取り組みは、情報の分類に留まり、問題を十分に対処していない。 提案された包括…
4月 01 2024 0 ELITR-Bench: 長い文脈の言語モデルのための会議アシスタントベンチマーク 投稿者: ユウ 要点 大規模言語モデル(LLM)の文脈ウィンドウが大幅に拡大している。 実際の会議アシスタントシナリオに焦点を当てた新しいベンチマークELITR-Benchを提案。 自動音声認識によって得られたトランスクリプトの長い文脈…
4月 01 2024 0 LLMが医師を支援する?! 投稿者: ユウ 要点 この論文は、大規模言語モデル(LLM)が医療意思決定タスクで医師を支援し、場合によっては訂正する可能性を探るものです。 Meditron、Llama2、Mistralなどの複数のLLMを評価し、異なるシナリオで医師…
4月 01 2024 0 Gecko: 大規模言語モデルから抽出された多用途テキスト埋め込みについて 投稿者: ユウ 要点 Geckoは、大規模言語モデル(LLM)から知識を抽出して、コンパクトで多用途なテキスト埋め込みモデルを作成する。 二段階の蒸留プロセスを使用し、多様な合成ペアデータを生成した後、候補パッセージを取得して正のパッセ…
4月 01 2024 0 LC-LLM: 説明可能なレーン変更意図と軌道予測 投稿者: ユウ 要点 自動運転車が周囲の車両のレーン変更意図を事前に正確に予測し、将来の軌道を予測する能力を持つことが重要である。 既存の動き予測手法は、長期予測の精度と解釈可能性の面で改善の余地がある。 本論文では、LC-LLMという…