

授课语言
中文
常规申请费用
23,930
位置
上海
X ACADEMY
全球开拓者峰会
-
2025.07.23 - 08.05
主修课 X-Core
主修课 X-Core
主修课 X-Core
人工智能前沿技术课程(多模态学习方向)
Artificial Intelligence and Emerging Technologies (Multimodal Learning)
COURSE INTRO
课程简介 01
COURSE INTRO
课程简介 01
随着人类生活数据的丰富和人工智能技术的飞跃发展,我们正迈入多模态智能时代的黎明——它让 AI 跨越单一感官,综合语音、语言、视觉等处理多种信息,做出更「智能」的判断。不论是分析文章,还是“看到”图中的情绪,亦或是通过声音探测环境变化,更深入地理解复杂情境,作出决策,AI 都将能做到。而在未来,AI 能否真正成为人类跨领域洞察和决策的有力助手?或是发展出超越人类的综合能力?多模态技术为我们留有巨大的想象与实践空间。
「TechX 人工智能前沿技术课程(多模态学习方向)」将带你从多模态数据处理的基础入手,逐步揭开多模态模型的神秘面纱。你将学习如何利用 Transformer 架构处理跨领域的数据,探索像 OpenAI o1 的大型多模态模型的内部原理与前沿应用。通过项目实践,如构建能够阅读书籍并同时分析插图的 AI,或者开发结合声音、视觉与文本的智能交互系统,你将掌握多模态技术的现实应用,感受科技进步带来的无限可能。
*「TechX 人工智能前沿技术课程」将涵盖人工智能基本知识与数据处理技术,并在此基础上根据时下热门前沿领域分为两个侧重方向,分别为数据科学、多模态学习方向。在 X-Portal 上进行申请并选择课程志愿时,你只需选择「TechX 人工智能前沿技术课程」作为第一志愿。在被正式录取并确认出席后,你将收到一份课程意向与基础调查问卷用于进一步收集你的个人兴趣与专业背景,以确定最终的课程方向。
随着人类生活数据的丰富和人工智能技术的飞跃发展,我们正迈入多模态智能时代的黎明——它让 AI 跨越单一感官,综合语音、语言、视觉等处理多种信息,做出更「智能」的判断。不论是分析文章,还是“看到”图中的情绪,亦或是通过声音探测环境变化,更深入地理解复杂情境,作出决策,AI 都将能做到。而在未来,AI 能否真正成为人类跨领域洞察和决策的有力助手?或是发展出超越人类的综合能力?多模态技术为我们留有巨大的想象与实践空间。
「TechX 人工智能前沿技术课程(多模态学习方向)」将带你从多模态数据处理的基础入手,逐步揭开多模态模型的神秘面纱。你将学习如何利用 Transformer 架构处理跨领域的数据,探索像 OpenAI o1 的大型多模态模型的内部原理与前沿应用。通过项目实践,如构建能够阅读书籍并同时分析插图的 AI,或者开发结合声音、视觉与文本的智能交互系统,你将掌握多模态技术的现实应用,感受科技进步带来的无限可能。
*「TechX 人工智能前沿技术课程」将涵盖人工智能基本知识与数据处理技术,并在此基础上根据时下热门前沿领域分为两个侧重方向,分别为数据科学、多模态学习方向。在 X-Portal 上进行申请并选择课程志愿时,你只需选择「TechX 人工智能前沿技术课程」作为第一志愿。在被正式录取并确认出席后,你将收到一份课程意向与基础调查问卷用于进一步收集你的个人兴趣与专业背景,以确定最终的课程方向。



COURSE OUTCOME
课程产出 02
COURSE OUTCOME
课程产出 02
课程结束时,你将有机会运用所学,完成以下其中一种类型的产出,例如:
设计一个多模态健康监测平台,将健康数据、影像和文本(医生笔记)整合,为医生提供全面的诊断支持,提升诊疗的准确性和效率
创建一个基于多模态数据的灾害应急响应系统,通过整合地理数据、天气信息和社交媒体内容,实现实时灾害监控和预测,帮助政府和组织更迅速地做出应对决策
……
*最终产出的类型与内容,以探索者在参与顶点项目 X-Capstone 后的成品为准
课程结束时,你将有机会运用所学,完成以下其中一种类型的产出,例如:
设计一个多模态健康监测平台,将健康数据、影像和文本(医生笔记)整合,为医生提供全面的诊断支持,提升诊疗的准确性和效率
创建一个基于多模态数据的灾害应急响应系统,通过整合地理数据、天气信息和社交媒体内容,实现实时灾害监控和预测,帮助政府和组织更迅速地做出应对决策
……
*最终产出的类型与内容,以探索者在参与顶点项目 X-Capstone 后的成品为准
POTENTIAL OPPORTUNITIES
发展方向 03
POTENTIAL OPPORTUNITIES
发展方向 03
对学习多模态数据处理与人工智能有浓厚兴趣,希望学习精准探索各类热点话题和科技领域的研究手段,为在信息时代开展多领域研究提供坚实的方法论基础;
未来想要从事数据分析、多模态模型、人机交互和人工智能等领域的工作。
对学习多模态数据处理与人工智能有浓厚兴趣,希望学习精准探索各类热点话题和科技领域的研究手段,为在信息时代开展多领域研究提供坚实的方法论基础;
未来想要从事数据分析、多模态模型、人机交互和人工智能等领域的工作。
COURSE CONTENTS
课程内容 04
COURSE CONTENTS
课程内容 04
01 多模态学习导论与基础
理论:
多模态研究介绍:探讨多模态学习的核心概念、重要性以及当前面临的主要研究与技术挑战。
课程大纲与要求:详细解读课程的整体结构、学习目标、评分标准以及学员的期望。
多模态应用场景:展示多模态技术在各个领域的实际应用案例,如情感分析、智能问答、内容生成等。
常用数据集概览:介绍多模态研究中常用的公开数据集及其特点。
团队项目介绍:说明课程项目的目标、分组方式、时间节点和预期成果。
机器学习基础回顾:补充或复习贝叶斯定理、最大似然估计 (ML) 等核心机器学习概念,为后续学习打下基础。
实践:
环境配置;贝叶斯分类器实践;多模态数据集探索;团队项目初步规划
02 神经网络基础与优化
理论:
数据表示基础:学习语言(如词向量)、视觉(如像素、特征描述子)和音频(如声谱图)数据的基本表示方法。
损失函数:介绍常用的损失函数(如交叉熵损失、均方误差损失)及其在不同任务中的选择。
神经网络入门:讲解多层感知机 (MLP)、激活函数等神经网络基本构成单元。
梯度与反向传播:深入理解梯度下降法和反向传播算法的原理与计算过程。
深度模型优化实践:探讨学习率调整、正则化、Batch Normalization、Dropout 等常见的深度学习模型优化技巧和策略。
实践:
深度学习框架入门;MLP 搭建与训练;优化器与超参数实验;过拟合与欠拟合观察
03 单模态与多模态表示学习
理论:
视觉单模态表示 - CNN:学习卷积核、卷积操作的原理,掌握卷积神经网络 (CNN) 的基本架构。
高级 CNN 架构:了解残差网络 (ResNet) 和跳跃连接 (Skip Connection) 的设计思想及其解决的问题。
语言单模态表示 - RNN/LSTM:学习门控循环单元 (GRU) 和长短期记忆网络 (LSTM) 的内部结构与工作原理。
时间反向传播 (BPTT):理解 BPTT 算法在训练循环神经网络时的应用。
多模态自编码器:介绍如何使用自编码器学习数据的多模态表示。
联合表示方法 (Joint Representations):探讨将不同模态信息映射到共享表示空间的基本策略。
实践:
CNN 特征提取;LSTM/GRU 文本分类;词向量初步探索;简单多模态自编码器
04 多模态协同表示与对齐
理论:
协同表示方法 - DCCA:学习深度典型相关分析 (Deep Canonical Correlation Analysis, DCCA) 如何学习跨模态的协同表示。
协同表示方法 - NMF:了解非负矩阵分解 (Non-negative Matrix Factorization, NMF) 在多模态数据融合中的应用。
显式对齐 - DTW:掌握动态时间规整 (Dynamic Time Warping, DTW) 算法原理及其在序列对齐中的应用。
隐式对齐 - 注意力机制:深入学习注意力机制 (Attention Mechanism) 的基本原理及其在多模态任务中的重要性。
多头注意力 (Multi-Head Attention):理解多头注意力如何从不同子空间捕获信息。
多模态 Transformer:学习如何将 Transformer 架构扩展到多模态数据处理,实现模态间的对齐与融合。
实践:
DTW 算法实现与应用;注意力机制可视化与理解;Transformer Encoder/Decoder 模块探索;简单 NMF 应用
05 大模型初探
理论:
大模型基础架构:介绍当前主流大语言模型 (LLM) 的核心架构特点,如 Transformer 的 Encoder-Decoder 结构、Decoder-only 结构等。
主流大模型概览:简要介绍几个知名的大模型(如 GPT 系列、BERT 系列、T5 等)及其主要贡献和应用领域。
实践:
Git 与协作工具使用;大模型 API 体验;Prompt Engineering 初探
06 多模态对齐、翻译与图模型
理论:
对齐与翻译 - 模块化网络:学习如何通过模块化设计构建灵活的多模态翻译和对齐模型。
基于树与堆栈的模型:探讨树形结构和堆栈机制在处理层级化或结构化多模态数据(如场景图、程序代码)中的应用。
概率图模型 (PGM) - 动态贝叶斯网络 (DBN):介绍 DBN 的基本概念及其在建模时序多模态数据中的应用。
耦合与因子隐马尔可夫模型 (CHMM/FHMM):学习 CHMM 和 FHMM 如何处理多个相互依赖的模态序列。
判别式图模型 - 条件随机场 (CRF):掌握 CRF 的原理及其在序列标注和结构化预测任务中的优势。
连续与全连接 CRF:了解 CRF 在连续数据和稠密连接场景下的扩展。
实践:
CRF 序列标注实践;PGM 库入门 (pgmpy);HMM 应用于简单序列
07 深度生成模型与强化学习
理论:
深度生成模型 - 变分自编码器 (VAE):学习 VAE 的原理、目标函数(ELBO)以及如何生成新的数据样本。
深度生成模型 - 生成对抗网络 (GAN):掌握 GAN 的基本思想、生成器与判别器的博弈过程以及常见的训练挑战。
强化学习 (RL) 基础 - 马尔可夫决策过程 (MDP):理解 MDP 的组成要素(状态、动作、奖励、转移概率)。
Q 学习与深度 Q 学习 (DQN):学习基于价值的 RL 方法 Q-learning 及其与深度学习结合的 DQN。
策略梯度 (Policy Gradients):了解基于策略的 RL 方法,如 REINFORCE 算法。
多模态强化学习应用场景:探讨 RL 在多模态交互、机器人控制、对话系统等领域的应用。
实践:
VAE 实现与样本生成;GAN 概念验证;Q-Learning 实践 (Grid World);DQN 概念介绍与代码阅读
08 多模态融合、前沿进展与具身智能
理论:
融合与协同学习 - 多核学习 (MKL):介绍 MKL 如何有效地组合来自不同模态或特征源的核函数进行融合。
少样本学习 (Few-Shot Learning):探讨在数据稀疏的多模态场景下,如何利用少样本学习技术提升模型性能。
协同学习 (Co-learning/Co-training):了解协同学习如何利用不同视图或模态的信息相互增强学习效果。
多模态最新研究方向:概览当前多模态学习领域的前沿进展,如可解释性、鲁棒性、高效学习等。
具身语言理解 (Embodied Language Understanding):探讨如何将语言理解与物理世界的感知和动作联系起来,实现具身智能。
实践:
少样本学习代码示例;多模态融合策略讨论与实现
09 多模态语言学习、跨模态连接与伦理
理论:
多模态启发式语言学习:探讨如何利用环境、视觉等非语言模态信息启发和辅助语言模型的学习。
图文连接学习 - 话语分析:学习如何分析文本中的话语结构,并将其与视觉内容进行深层次关联。
图文连接学习 - 图文融合:探讨更高级的图像和文本融合技术,以实现更精准的跨模态理解与生成。
偏见与公平性:讨论多模态模型中可能存在的偏见来源(数据、算法等)及其社会影响。
计算伦理学:介绍在开发和部署多模态 AI 系统时需要考虑的伦理原则和最佳实践,确保技术的负责任发展。
课程总结与展望:回顾课程主要内容,展望多模态学习的未来发展趋势。
实践:
多模态模型偏见分析实践;AI 伦理案例研讨;课程回顾与未来学习路径规划
01 多模态学习导论与基础
理论:
多模态研究介绍:探讨多模态学习的核心概念、重要性以及当前面临的主要研究与技术挑战。
课程大纲与要求:详细解读课程的整体结构、学习目标、评分标准以及学员的期望。
多模态应用场景:展示多模态技术在各个领域的实际应用案例,如情感分析、智能问答、内容生成等。
常用数据集概览:介绍多模态研究中常用的公开数据集及其特点。
团队项目介绍:说明课程项目的目标、分组方式、时间节点和预期成果。
机器学习基础回顾:补充或复习贝叶斯定理、最大似然估计 (ML) 等核心机器学习概念,为后续学习打下基础。
实践:
环境配置;贝叶斯分类器实践;多模态数据集探索;团队项目初步规划
02 神经网络基础与优化
理论:
数据表示基础:学习语言(如词向量)、视觉(如像素、特征描述子)和音频(如声谱图)数据的基本表示方法。
损失函数:介绍常用的损失函数(如交叉熵损失、均方误差损失)及其在不同任务中的选择。
神经网络入门:讲解多层感知机 (MLP)、激活函数等神经网络基本构成单元。
梯度与反向传播:深入理解梯度下降法和反向传播算法的原理与计算过程。
深度模型优化实践:探讨学习率调整、正则化、Batch Normalization、Dropout 等常见的深度学习模型优化技巧和策略。
实践:
深度学习框架入门;MLP 搭建与训练;优化器与超参数实验;过拟合与欠拟合观察
03 单模态与多模态表示学习
理论:
视觉单模态表示 - CNN:学习卷积核、卷积操作的原理,掌握卷积神经网络 (CNN) 的基本架构。
高级 CNN 架构:了解残差网络 (ResNet) 和跳跃连接 (Skip Connection) 的设计思想及其解决的问题。
语言单模态表示 - RNN/LSTM:学习门控循环单元 (GRU) 和长短期记忆网络 (LSTM) 的内部结构与工作原理。
时间反向传播 (BPTT):理解 BPTT 算法在训练循环神经网络时的应用。
多模态自编码器:介绍如何使用自编码器学习数据的多模态表示。
联合表示方法 (Joint Representations):探讨将不同模态信息映射到共享表示空间的基本策略。
实践:
CNN 特征提取;LSTM/GRU 文本分类;词向量初步探索;简单多模态自编码器
04 多模态协同表示与对齐
理论:
协同表示方法 - DCCA:学习深度典型相关分析 (Deep Canonical Correlation Analysis, DCCA) 如何学习跨模态的协同表示。
协同表示方法 - NMF:了解非负矩阵分解 (Non-negative Matrix Factorization, NMF) 在多模态数据融合中的应用。
显式对齐 - DTW:掌握动态时间规整 (Dynamic Time Warping, DTW) 算法原理及其在序列对齐中的应用。
隐式对齐 - 注意力机制:深入学习注意力机制 (Attention Mechanism) 的基本原理及其在多模态任务中的重要性。
多头注意力 (Multi-Head Attention):理解多头注意力如何从不同子空间捕获信息。
多模态 Transformer:学习如何将 Transformer 架构扩展到多模态数据处理,实现模态间的对齐与融合。
实践:
DTW 算法实现与应用;注意力机制可视化与理解;Transformer Encoder/Decoder 模块探索;简单 NMF 应用
05 大模型初探
理论:
大模型基础架构:介绍当前主流大语言模型 (LLM) 的核心架构特点,如 Transformer 的 Encoder-Decoder 结构、Decoder-only 结构等。
主流大模型概览:简要介绍几个知名的大模型(如 GPT 系列、BERT 系列、T5 等)及其主要贡献和应用领域。
实践:
Git 与协作工具使用;大模型 API 体验;Prompt Engineering 初探
06 多模态对齐、翻译与图模型
理论:
对齐与翻译 - 模块化网络:学习如何通过模块化设计构建灵活的多模态翻译和对齐模型。
基于树与堆栈的模型:探讨树形结构和堆栈机制在处理层级化或结构化多模态数据(如场景图、程序代码)中的应用。
概率图模型 (PGM) - 动态贝叶斯网络 (DBN):介绍 DBN 的基本概念及其在建模时序多模态数据中的应用。
耦合与因子隐马尔可夫模型 (CHMM/FHMM):学习 CHMM 和 FHMM 如何处理多个相互依赖的模态序列。
判别式图模型 - 条件随机场 (CRF):掌握 CRF 的原理及其在序列标注和结构化预测任务中的优势。
连续与全连接 CRF:了解 CRF 在连续数据和稠密连接场景下的扩展。
实践:
CRF 序列标注实践;PGM 库入门 (pgmpy);HMM 应用于简单序列
07 深度生成模型与强化学习
理论:
深度生成模型 - 变分自编码器 (VAE):学习 VAE 的原理、目标函数(ELBO)以及如何生成新的数据样本。
深度生成模型 - 生成对抗网络 (GAN):掌握 GAN 的基本思想、生成器与判别器的博弈过程以及常见的训练挑战。
强化学习 (RL) 基础 - 马尔可夫决策过程 (MDP):理解 MDP 的组成要素(状态、动作、奖励、转移概率)。
Q 学习与深度 Q 学习 (DQN):学习基于价值的 RL 方法 Q-learning 及其与深度学习结合的 DQN。
策略梯度 (Policy Gradients):了解基于策略的 RL 方法,如 REINFORCE 算法。
多模态强化学习应用场景:探讨 RL 在多模态交互、机器人控制、对话系统等领域的应用。
实践:
VAE 实现与样本生成;GAN 概念验证;Q-Learning 实践 (Grid World);DQN 概念介绍与代码阅读
08 多模态融合、前沿进展与具身智能
理论:
融合与协同学习 - 多核学习 (MKL):介绍 MKL 如何有效地组合来自不同模态或特征源的核函数进行融合。
少样本学习 (Few-Shot Learning):探讨在数据稀疏的多模态场景下,如何利用少样本学习技术提升模型性能。
协同学习 (Co-learning/Co-training):了解协同学习如何利用不同视图或模态的信息相互增强学习效果。
多模态最新研究方向:概览当前多模态学习领域的前沿进展,如可解释性、鲁棒性、高效学习等。
具身语言理解 (Embodied Language Understanding):探讨如何将语言理解与物理世界的感知和动作联系起来,实现具身智能。
实践:
少样本学习代码示例;多模态融合策略讨论与实现
09 多模态语言学习、跨模态连接与伦理
理论:
多模态启发式语言学习:探讨如何利用环境、视觉等非语言模态信息启发和辅助语言模型的学习。
图文连接学习 - 话语分析:学习如何分析文本中的话语结构,并将其与视觉内容进行深层次关联。
图文连接学习 - 图文融合:探讨更高级的图像和文本融合技术,以实现更精准的跨模态理解与生成。
偏见与公平性:讨论多模态模型中可能存在的偏见来源(数据、算法等)及其社会影响。
计算伦理学:介绍在开发和部署多模态 AI 系统时需要考虑的伦理原则和最佳实践,确保技术的负责任发展。
课程总结与展望:回顾课程主要内容,展望多模态学习的未来发展趋势。
实践:
多模态模型偏见分析实践;AI 伦理案例研讨;课程回顾与未来学习路径规划
PREREQUISITES
前置要求 05
PREREQUISITES
前置要求 05
线性代数,微积分,基础的统计知识,基础 Python 编程知识,对机器学习和深度学习有一定的了解。
*预习阶段导师与学术领袖将帮助你完成前置要求的学习
线性代数,微积分,基础的统计知识,基础 Python 编程知识,对机器学习和深度学习有一定的了解。
*预习阶段导师与学术领袖将帮助你完成前置要求的学习
"XA 给我自己带来了什么, CS 素养的提高自是不必说,我更感谢的是,能让我遇到最顶尖最优秀的一批同龄人。我见到了活生生的 MIT,CIT 学生,请教了无所不能 debug 的助教,也收获了一堆桌游好友。或许说自己的梦想是改变世界是会被人笑话的,但 XA 给了我把梦想化为现实的底气。
这条路好长,去的地方有诗和理想。昨天留下的一滩泪和汗,造就现在的我越倔强越勇敢。这是 XA 带给我教会我的:我们永远都还可以更勇敢一点。"
Haiyi Jin 探索者
复旦大学
"XA 给我自己带来了什么, CS 素养的提高自是不必说,我更感谢的是,能让我遇到最顶尖最优秀的一批同龄人。我见到了活生生的 MIT,CIT 学生,请教了无所不能 debug 的助教,也收获了一堆桌游好友。或许说自己的梦想是改变世界是会被人笑话的,但 XA 给了我把梦想化为现实的底气。
这条路好长,去的地方有诗和理想。昨天留下的一滩泪和汗,造就现在的我越倔强越勇敢。这是 XA 带给我教会我的:我们永远都还可以更勇敢一点。"
Haiyi Jin 探索者
复旦大学
"XA 给我自己带来了什么, CS 素养的提高自是不必说,我更感谢的是,能让我遇到最顶尖最优秀的一批同龄人。我见到了活生生的 MIT,CIT 学生,请教了无所不能 debug 的助教,也收获了一堆桌游好友。或许说自己的梦想是改变世界是会被人笑话的,但 XA 给了我把梦想化为现实的底气。
这条路好长,去的地方有诗和理想。昨天留下的一滩泪和汗,造就现在的我越倔强越勇敢。这是 XA 带给我教会我的:我们永远都还可以更勇敢一点。"
复旦大学



MENTORS
学术导师 06
MENTORS
课程导师 06

黎世伦 Allan
2023、2025 学术导师
加州大学伯克利分校数学博士
斯坦福大学数学荣誉学士、计算机硕士
曾参与斯坦福自然语言处理实验室 Chris Manning 教授 BERT 模型相关原理研究項目;在斯坦福视觉与学习实验室参与李飞飞教授的行人预测项目。研究兴趣包括深度学习和自动化定理证明、微分几何、理论计算机。平时喜欢滑雪、潜水、渔猎、山地速降、打篮球。
黎世伦 Allan
2023、2025 学术导师
加州大学伯克利分校数学博士
斯坦福大学数学荣誉学士、计算机硕士
曾参与斯坦福自然语言处理实验室 Chris Manning 教授 BERT 模型相关原理研究項目;在斯坦福视觉与学习实验室参与李飞飞教授的行人预测项目。研究兴趣包括深度学习和自动化定理证明、微分几何、理论计算机。平时喜欢滑雪、潜水、渔猎、山地速降、打篮球。
ACADEMIC LEADS
学术助教 07
ACADEMIC LEADS
课程助教 07
古天骏 Grady
2023 - 2025 学术助教
华东师范大学 计算机科学与技术硕士在读
主要研究方向为 End-to-End Navigetion、多模态大模型、具身智能、计算机视觉等,先后在百度和腾讯优图实验室从事多模态大模型算法实习工作,多篇论文投稿至iccv、neurips等计算机顶级会议/期刊。目前正在研究End-to-End Navigetion与空间推理以及多模态大模型,平常爱好篮球、说唱、桌游(各种牌类游戏)和电子竞技。
骆天浩 Tianhao
2025 学术助教
哈佛医学院生物医学信息学(AI in Medicine)博士在读
宾夕法尼亚大学沃顿商学院与文理学院双荣誉学位,主修数学、计算生物学与统计学
研究方向涵盖生物医学数据多模态整合(multimodal integration for biomedical data)、数字病理学(digital pathology)、空间转录组学(spatial transcriptomics)与单细胞组学(single-cell omics);未来致力于多模态 AI 在药物发现(drug discovery)、疗效预测(response prediction)及早期疾病诊断(early-stage disease diagnosis)中的应用。平时爱好听古典乐、去交响和室内乐concerts、拉小提琴、长跑等。
陆天一 Sky
2020 - 2025 学术助教
布朗大学 计算机硕士在读
卡尔顿学院 计算机科学与数学双学位学士
作为初创团队全栈开发成员参与 Flowith、Mirro AI 等项目,主导产品入选「奇迹创坛」Demo Day 和上榜 Product Hunt 月度产品。曾在 Web 3 及量化金融公司进行高性能跨平台应用开发相关实习。深度参与XA 四年筹备工作并担任学院组负责人。在学校多学期担任计算机系统课助教,开展对视觉算法的对抗性攻击防御研究,带领团队获得 MetaCTF 比赛大学组 Top。乐队主音吉他手,爵士室内乐团吉他手,寝室指弹吉他手。
古天骏 Grady
2023 - 2025 学术助教
华东师范大学 计算机科学与技术硕士在读
主要研究方向为 End-to-End Navigetion、多模态大模型、具身智能、计算机视觉等,先后在百度和腾讯优图实验室从事多模态大模型算法实习工作,多篇论文投稿至iccv、neurips等计算机顶级会议/期刊。目前正在研究End-to-End Navigetion与空间推理以及多模态大模型,平常爱好篮球、说唱、桌游(各种牌类游戏)和电子竞技。
骆天浩 Tianhao
2025 学术助教
哈佛医学院生物医学信息学(AI in Medicine)博士在读
宾夕法尼亚大学沃顿商学院与文理学院双荣誉学位,主修数学、计算生物学与统计学
研究方向涵盖生物医学数据多模态整合(multimodal integration for biomedical data)、数字病理学(digital pathology)、空间转录组学(spatial transcriptomics)与单细胞组学(single-cell omics);未来致力于多模态 AI 在药物发现(drug discovery)、疗效预测(response prediction)及早期疾病诊断(early-stage disease diagnosis)中的应用。平时爱好听古典乐、去交响和室内乐concerts、拉小提琴、长跑等。
陆天一 Sky
2020 - 2025 学术助教
布朗大学 计算机硕士在读
卡尔顿学院 计算机科学与数学双学位学士
作为初创团队全栈开发成员参与 Flowith、Mirro AI 等项目,主导产品入选「奇迹创坛」Demo Day 和上榜 Product Hunt 月度产品。曾在 Web 3 及量化金融公司进行高性能跨平台应用开发相关实习。深度参与XA 四年筹备工作并担任学院组负责人。在学校多学期担任计算机系统课助教,开展对视觉算法的对抗性攻击防御研究,带领团队获得 MetaCTF 比赛大学组 Top。乐队主音吉他手,爵士室内乐团吉他手,寝室指弹吉他手。
授课语言
中文
当前课程费用
23,930
位置
上海
X ACADEMY
全球开拓者峰会
-
2024.07.25 - 08.06
位置
上海
授课语言
中文
当前课程费用
23,930
X ACADEMY
全球开拓者峰会
-
2024.07.25 - 08.07
常见问题 FAQ
主修课师生比怎么样?
主修课师生比怎么样?
主修课师生比怎么样?
听说 X ACADEMY 的主修课非常硬核,开课时会不会跟不上?
听说 X ACADEMY 的主修课非常硬核,开课时会不会跟不上?
听说 X ACADEMY 的主修课非常硬核,开课时会不会跟不上?
在 X ACADEMY 我只能学习一门主修课程吗?
在 X ACADEMY 我只能学习一门主修课程吗?
在 X ACADEMY 我只能学习一门主修课程吗?
联系我们 Contact Us
© 2024 | 上海得斯教育科技有限公司 | 成立于 2016. | 沪ICP备2021004001号-6
OUR CIVILIZATION WAS BUILT ON TECHNOLOGY. OUR CIVILIZATION IS BUILT ON TECHNOLOGY. TECHNOLOGY IS THE GLORY OF HUMAN AMBITION AND ACHIEVEMENT, THE SPEARHEAD OF PROGRESS, AND THE REALIZATION OF OUR POTENTIAL. FOR HUNDREDS OF YEARS, WE PROPERLY GLORIFIED THIS – UNTIL RECENTLY. WE, AT X ACADEMY, ARE HERE TO REVITALIZE THAT SPIRIT. TO US, THE FUTURE IS A CANVAS OF VAST POSSIBILITY, PAINTED WITH THE BRUSHES OF INNOVATION, CREATIVITY, AND OPTIMISM. WE BELIEVE IN A FUTURE WHERE TECHNOLOGY CONTINUES TO BE THE BACKBONE OF ADVANCEMENT, NOT JUST IN MATERIAL TERMS BUT AS A MEANS TO ELEVATE HUMAN EXPERIENCE AND CONSCIOUSNESS. WE ARE THE FUTURE OPTIMISTS, THE DREAMERS, THE MAKERS, AND THE DOERS. WE STAND READY TO COLLABORATE, TO INNOVATE, AND TO BUILD A BETTER TOMORROW WITH YOU. JOIN US, AS WE EMBARK ON THIS JOURNEY TO IGNITE THE FLAMES OF PROGRESS AND TO CHERISH THE TECHNOLOGY THAT MAKES IT POSSIBLE. IT IS TIME, ONCE AGAIN, TO RAISE THE TECHNOLOGY FLAG. IT IS TIME TO BE TECHNO-OPTIMISTS. WITH X ACADEMY, LET'S BUILD A BRIGHTER FUTURE TOGETHER.
联系我们 Contact Us
© 2024 | 上海得斯教育科技有限公司 | 成立于 2016. |
OUR CIVILIZATION WAS BUILT ON TECHNOLOGY. OUR CIVILIZATION IS BUILT ON TECHNOLOGY. TECHNOLOGY IS THE GLORY OF HUMAN AMBITION AND ACHIEVEMENT, THE SPEARHEAD OF PROGRESS, AND THE REALIZATION OF OUR POTENTIAL. FOR HUNDREDS OF YEARS, WE PROPERLY GLORIFIED THIS – UNTIL RECENTLY. WE, AT X ACADEMY, ARE HERE TO REVITALIZE THAT SPIRIT. TO US, THE FUTURE IS A CANVAS OF VAST POSSIBILITY, PAINTED WITH THE BRUSHES OF INNOVATION, CREATIVITY, AND OPTIMISM. WE BELIEVE IN A FUTURE WHERE TECHNOLOGY CONTINUES TO BE THE BACKBONE OF ADVANCEMENT, NOT JUST IN MATERIAL TERMS BUT AS A MEANS TO ELEVATE HUMAN EXPERIENCE AND CONSCIOUSNESS. WE ARE THE FUTURE OPTIMISTS, THE DREAMERS, THE MAKERS, AND THE DOERS. WE STAND READY TO COLLABORATE, TO INNOVATE, AND TO BUILD A BETTER TOMORROW WITH YOU. JOIN US, AS WE EMBARK ON THIS JOURNEY TO IGNITE THE FLAMES OF PROGRESS AND TO CHERISH THE TECHNOLOGY THAT MAKES IT POSSIBLE. IT IS TIME, ONCE AGAIN, TO RAISE THE TECHNOLOGY FLAG. IT IS TIME TO BE TECHNO-OPTIMISTS. WITH X ACADEMY, LET'S BUILD A BRIGHTER FUTURE TOGETHER.
联系我们 Contact Us
© 2024 | 上海得斯教育科技有限公司 | 成立于 2016. |
OUR CIVILIZATION WAS BUILT ON TECHNOLOGY. OUR CIVILIZATION IS BUILT ON TECHNOLOGY. TECHNOLOGY IS THE GLORY OF HUMAN AMBITION AND ACHIEVEMENT, THE SPEARHEAD OF PROGRESS, AND THE REALIZATION OF OUR POTENTIAL. FOR HUNDREDS OF YEARS, WE PROPERLY GLORIFIED THIS – UNTIL RECENTLY. WE, AT X ACADEMY, ARE HERE TO REVITALIZE THAT SPIRIT. TO US, THE FUTURE IS A CANVAS OF VAST POSSIBILITY, PAINTED WITH THE BRUSHES OF INNOVATION, CREATIVITY, AND OPTIMISM. WE BELIEVE IN A FUTURE WHERE TECHNOLOGY CONTINUES TO BE THE BACKBONE OF ADVANCEMENT, NOT JUST IN MATERIAL TERMS BUT AS A MEANS TO ELEVATE HUMAN EXPERIENCE AND CONSCIOUSNESS. WE ARE THE FUTURE OPTIMISTS, THE DREAMERS, THE MAKERS, AND THE DOERS. WE STAND READY TO COLLABORATE, TO INNOVATE, AND TO BUILD A BETTER TOMORROW WITH YOU. JOIN US, AS WE EMBARK ON THIS JOURNEY TO IGNITE THE FLAMES OF PROGRESS AND TO CHERISH THE TECHNOLOGY THAT MAKES IT POSSIBLE. IT IS TIME, ONCE AGAIN, TO RAISE THE TECHNOLOGY FLAG. IT IS TIME TO BE TECHNO-OPTIMISTS. WITH X ACADEMY, LET'S BUILD A BRIGHTER FUTURE TOGETHER.