第一章 GNN + 大模型
图神经网络与大语言模型结合,按 LLM 角色分为「增强器」与「预测器」两大范式
1.1 LLM 作为增强器(LLM as Enhancer)
LLM 在此范式中负责生成、扩充或优化图节点特征,为 GNN 的下游任务提供更丰富的语义表示。
#01
LLMRec: Large Language Models with Graph Augmentation for Recommendation
#04
Graph-Aware Language Model Pre-Training on a Large Graph Corpus Can Help Multiple Graph Applications
#05
Prompt-based Node Feature Extractor for Few-shot Learning on Text-Attributed Graphs
1.2 LLM 作为预测器(LLM as Predictor)
LLM 直接接受图结构信息并输出预测结果,探索语言模型理解与推理图问题的潜力边界。
#08
GPT4Graph: Can Large Language Models Understand Graph Structured Data? An Empirical Evaluation and Benchmarking
第二章 LLM + RAG 创新思路
检索增强生成领域 9 种最新创新方向,覆盖自适应检索、自我反思、领域专用微调及安全攻防
来源说明:深度之眼整理出品
2.1 核心技术方向
#01
Enhancing LLM Factual Accuracy with RAG to Counter Hallucinations: A Case Study on Domain-Specific Queries in Private Knowledge-Bases
#02
Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity
#04
RAG-Driver: Generalisable Driving Explanations with Retrieval-Augmented In-Context Learning in Multi-Modal Large Language Model
#05
DRAGIN: Dynamic Retrieval Augmented Generation based on the Real-time Information Needs of Large Language Models
#06
SELF-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection
大型语言模型仅依赖内部参数知识时容易产生事实错误。SELF-RAG 引入自反思检索增强生成框架,通过按需检索与自我反思标记(Reflection Token)机制,使 LLM 能够自适应地检索段落,并对检索内容和自身输出进行质量评估。
实验表明,SELF-RAG(7B / 13B)在开放域问答、推理、事实验证等多项任务上显著优于最先进的基线,兼顾多功能性与生成准确性。
2.2 安全与信息精炼
#07
PoisonedRAG: Knowledge Poisoning Attacks to Retrieval-Augmented Generation of Large Language Models
#08
Unsupervised Information Refinement Training of Large Language Models for Retrieval-Augmented Generation
#09
ARM-RAG: Enhancing LLM Intelligence with ARM-RAG: Auxiliary Rationale Memory for Retrieval Augmented Generation
第三章 大模型 + 时间序列
探索 LLM 在时序预测、跨域建模方面的新范式,覆盖通用领域与垂直行业应用
3.1 通用时序预测
#02
OFA: One Fits All — Power General Time Series Analysis by Pretrained LM
#04
TEMPO: Prompt-based Generative Pre-trained Transformer for Time Series Forecasting
#05
TEST: Text Prototype Aligned Embedding to Activate LLM's Ability for Time Series
#06
LLM4TS: Two-Stage Fine-Tuning for Time-Series Forecasting with Pre-Trained LLMs
3.2 特定领域应用
第四章 大模型 + 小样本学习
以少量样本激活 LLM 强大的迁移与泛化能力,覆盖具身智能规划、低资源语言等场景
原文档标题为"12种大模型+小样本创新思路",当前可提取内容包含 2 篇详细介绍,原文档可能含更多条目待完善。
#01
LLM-Planner: Few-Shot Grounded Planning for Embodied Agents with Large Language Models
核心思路:基于 LLM 的具身代理规划器,仅使用 <0.5% 训练数据即可媲美全量数据基线。
创新点:
创新点:
- 少样本学习:不到 0.5% 训练数据,性能与全数据训练的基线相当
- 物理基础规划:将环境中观测到的物体列表注入提示,增强 LLM 对物理环境的感知
- 动态再规划:执行中根据环境反馈动态调整计划,提升复杂场景适应性
- 真实环境验证:在 ALFRED 数据集上验证,覆盖多种部分可观察场景
#02
LLMs Are Few-Shot In-Context Low-Resource Language Learners
研究目标:缩小高资源与低资源语言间的性能差距,探究 LLM 在 25 种低资源语言和 7 种较高资源语言上的跨语言上下文学习能力(X-ICL)。
核心创新:提出查询对齐(Query Alignment)作为上下文标签对齐(Label Alignment)的更有效替代方案,为低资源语言上下文学习提供深入见解。
核心创新:提出查询对齐(Query Alignment)作为上下文标签对齐(Label Alignment)的更有效替代方案,为低资源语言上下文学习提供深入见解。
第五章 时空预测 + 大模型
将 LLM 能力融入时空图与时序知识图谱,覆盖动作识别、股票预测、轨迹挖掘、知识图谱补全等方向
原文档标题为"26种时空预测+大模型",当前可提取内容包含 7 篇论文(视频任务子章节未展开),整理来源:深度之眼。
5.1 时空图(Spatial-Temporal Graph)
| 论文名称 | 研究方向 | 论文链接 |
|---|---|---|
| Language knowledge assisted representation learning for skeleton-based action recognition | 骨架动作识别 | arXiv:2305.12398 |
| ChatGPT Informed Graph Neural Network for Stock Movement Prediction | 股票预测 | arXiv:2306.03763 | GitHub |
| Large Language Models for Spatial Trajectory Patterns Mining | 轨迹挖掘 | arXiv:2310.04942 |
5.2 时序知识图谱(Temporal Knowledge Graph)
| 论文名称 | 研究方向 | 论文链接 |
|---|---|---|
| Pre-trained language model with prompts for temporal knowledge graph completion | 知识图谱补全 | arXiv:2305.07912 |
| Knowledge graph completion models are few-shot learners: An empirical study of relation labeling in e-commerce with LLMs | 电商关系标注少样本 | arXiv:2305.09858 |
| Temporal knowledge graph forecasting without knowledge using in-context learning | 上下文学习预测 | arXiv:2305.10613 |
第六章 大模型 + 强化学习
探索 LLM 在强化学习中的多种功能角色,覆盖表征提取、自然语言翻译、决策辅助等创新思路
来源说明:深度之眼整理出品
6.1 LLM 作为信息处理者(LLM as Information Processor)
在富含文字和视觉信息的环境中,深度强化学习通常需要同时学习多模态信息处理和决策控制策略,导致学习效率大幅下降。LLM 可从以下两个维度介入,改善 RL 智能体的训练效率与泛化能力。
6.1.1 有效表征提取,加速下游神经网络学习
#03
Learning Transferable Visual Models from Natural Language Supervision(CLIP)
6.1.2 自然语言翻译:规范化任务语言,过滤无效信息
#07
Natural Language conditioned Reinforcement Learning with Inside-out Task Language Development and Translation(TALAR)
TALAR 在训练集上的任务成功率达 99.9%,在测试集上比 One-hot、Bert-binary、Bert-continuous 基线分别高出 30.7%、14.3%、23.5%,展示了将不规范自然语言指令翻译为规范任务语言的显著优势。
#08
STARLING: Self-supervised Training of Text-based Reinforcement Learning Agent with Large Language Models