[Wiki] [一覧]

LLMに関する論文

基礎論文(Top 5)

1. Attention Is All You Need

2. Neural Machine Translation by Jointly Learning to Align and Translate

3. Sequence to Sequence Learning with Neural Networks

4. Language Models are Unsupervised Multitask Learners

5. Language Models are Few-Shot Learners


最新研究論文(2026年5月-6月)

注意メカニズムと効率性

論文arXiv概要
Grammatically-Guided Sparse Attention for Efficient and Interpretable Transformershttps://arxiv.org/abs/2605.24518文法構造に基づく疎注意
A Generative Pre-trained Transformer with Kerr-soliton Attentionhttps://arxiv.org/abs/2605.24124物理ハードウェアベースの注意実装
Characterizing the Expressivity of Local Attention in Transformershttps://arxiv.org/abs/2605.00768ローカル注意の表現力分析
Kaczmarz Linear Attentionhttps://arxiv.org/abs/2605.08587線形注意による長文脈対応
Gated DeltaNet-2: Decoupling Erase and Write in Linear Attentionhttps://arxiv.org/abs/2605.22791線形注意の書き込み・消去の分離
Delta Attention: Residualshttps://arxiv.org/abs/2605.18855残差を用いた注意メカニズム
MiniMax Sparse Attentionhttps://arxiv.org/abs/2606.13392スパースアテンション最適化

推論・思考プロセス

論文arXiv概要
Reasoning Structure of Large Language Modelshttps://arxiv.org/abs/2606.03883推論構造の分析
HybridThinker: Efficient Chain-of-Thought Reasoning via Compressed Memoryhttps://arxiv.org/abs/2606.03768効率的なCoT推論
AdapTime: Adaptive Temporal Reasoninghttps://arxiv.org/abs/2604.24175時間適応的推論
Try Check and Retryhttps://arxiv.org/abs/2605.06651(修正と再試行のフレームワーク)
Toward Robust In-Context Learninghttps://arxiv.org/abs/2606.00014ロバストなIn-context学習

マルチモーダル・マルチリンガル

論文arXiv概要
SenseNova U1: Unifying Multimodal Understanding and Generationhttps://arxiv.org/abs/2605.12500マルチモーダル統合モデル
When Languages Disagree: Self-Evolving Multilingual LLM Judgeshttps://arxiv.org/abs/2606.08092マルチリンガル評価の自己改善
CORA: Analyzing Thinking Answer Gap in Multimodal RLVRhttps://arxiv.org/abs/2606.14691マルチモーダル推論分析
Robust U1 MLLMs: Self-Recovering Corrupted Visual Contenthttps://arxiv.org/abs/2606.08063ロバストなマルチモーダルLLM

AIエージェント・メモリ

論文arXiv概要
Arbor: Toward Generalist Autonomous Research Agenthttps://arxiv.org/abs/2606.11926自律研究エージェント
Harness 1: Reinforcement Learning for Search Agentshttps://arxiv.org/abs/2606.02373エージェント強化学習
MemPro: Agentic Memory Systems as Evolvable Programshttps://arxiv.org/abs/2606.00619進化可能なメモリシステム
From Storage to Experience: LLM Agent Memoryhttps://arxiv.org/abs/2605.06716エージェントメモリの実装
Behavioral Transfer in AI Agentshttps://arxiv.org/abs/2604.19925行動転移学習
SkillOpt: Executive Strategy for Self-Evolving Agent Skillshttps://arxiv.org/abs/2606.14066自己進化スキル最適化
SIA: Self-Improving AI with Harness Weight Updateshttps://arxiv.org/abs/2605.27276自己改善メカニズム

解釈可能性・安全性

論文arXiv概要
GYAN: An Explainable Neuro-Symbolic Language Modelhttps://arxiv.org/abs/2605.04759ニューロシンボリック解釈性
Generic Interpretation Approach for Transformer Models with Heterogenous Attention Structureshttps://arxiv.org/abs/2605.27458Transformer解釈方法
How LLMs Are Persuaded: A Few Attention Heads, Reroutedhttps://arxiv.org/abs/2605.09314LLM説得メカニズムの解析
Actionable Activation Directions for Detecting and Mitigating Emergent Misalignmenthttps://arxiv.org/abs/2606.19946ミスアライメント検出
Reverse CAPTCHA: Invisible Unicode Instruction Injectionhttps://arxiv.org/abs/2603.00164プロンプトインジェクション
Evaluating Language Models for Harmful Manipulationhttps://arxiv.org/abs/2603.25326有害性評価
Your Mouse and Eyes Secretly Leak Your Preferencehttps://arxiv.org/abs/2606.20482プライバシー分析

モデル最適化・学習方法

論文arXiv概要
ZAYA1-8B Technical Reporthttps://arxiv.org/abs/2605.05365小規模LLMの技術詳細
The MiniMax-M2 Serieshttps://arxiv.org/abs/2605.26494MiniMax最新モデル
DRPO: Rethinking Divergence Regularization in LLM RLhttps://arxiv.org/abs/2606.09821DPO改良版
Beyond Uniform Forgetting: Sequential Direct Preference Optimizationhttps://arxiv.org/abs/2606.19744優先学習最適化
Pruning via Causal Attributionhttps://arxiv.org/abs/2606.19350因果プルーニング
Revisiting Parameter-Based Knowledge Editinghttps://arxiv.org/abs/2606.00570知識編集手法
Large Language Models Explore by Latent Distillinghttps://arxiv.org/abs/2604.24927潜在蒸留

ベンチマーク・評価

論文arXiv概要
Agents Last Exam (ALE) Benchmarkhttps://arxiv.org/abs/2606.05405エージェント評価ベンチマーク
How Controllable Are Large Language Models?https://arxiv.org/abs/2603.02578制御可能性評価
How Human-Like Are LLMs? Register-Aware Evaluationhttps://arxiv.org/abs/2605.23651人間らしさ評価
FinRetrieval: Financial Data Retrieval Benchmarkhttps://arxiv.org/abs/2603.04403金融RAGベンチマーク
DLawBench: Evaluating LLMs in Multi-Turn Legal Consultationhttps://arxiv.org/abs/2606.13931法律相談評価

その他(応用・実装)

論文arXiv概要
dots_tts Technical Reporthttps://arxiv.org/abs/2606.07080テキスト音声合成
FastContext: Training Efficient Repository Explorer for Coding Agentshttps://arxiv.org/abs/2606.14066コーディングエージェント
Cosmos 3: Omnimodal World Models for Physical AIhttps://arxiv.org/abs/2606.14199物理シミュレーション
ART: Attention Run-time Terminationhttps://arxiv.org/abs/2606.00024注意実行時最適化
Leveraging LLMs to Improve Precision in Randomized Controlled Trialshttps://arxiv.org/abs/2605.30157RCT応用
AI Co-Mathematicianhttps://arxiv.org/abs/2605.06651数学協働
From Knowledge to Action: 2025 LLM Hackathonhttps://arxiv.org/abs/2605.03205v1ハッカソン報告書
AdaSR: Adaptive Streaming Reasoninghttps://arxiv.org/abs/2606.14694ストリーミング推論

参照リンク


更新日: 2026年6月19日