上海开源技术沙龙 #2 - 大模型技术实践分享日

报名已经结束
虽然 ChatGPT 面市尚不足两年,但大模型已逐步开始改变我们的工作,娱乐,生活,乃至企业的组织方式。越来越多的开发者与企业开始探索如何挖掘、利用大模型来提升自己和组织的能力与效率。

文本生成,长文本理解,图像生成,乃至视频生成,大模型的能力与场景依然保持着快节奏的迭代。我们需要时时学习大模型的技术知识,不断更新对行业的认知。因此,我们将以“大模型技术实践分享”为主题,组织今年的第二场上海开源技术沙龙。我们不但安排了众多技术专家为大家带来分享,还会留出足够的线下面对面交流时间。

如果您对大模型技术感兴趣,欢迎报名参加本次活动。线下席位有限,请尽早注册。


1. 推理分享嘉宾来自 Xorbits 和硅基流动。大模型的推理成本直接关系到大模型在应用场景和用户现场落地的可行性。大模型基础设施 (LLM Infra) 领域目前聚集了大量的优秀创业团队。把大模型的运行成本打下来,可能就得靠他们的突破了。Xorbits 未来速度创始人秦续业是资深的 Python 技术专家。Python 作为重要的机器学习与大模型编程语言,重要性不言而喻。Xorbits 的目标是构建分布式环境下的高性能 Python 计算框架。
硅基流动是袁进辉博士经历“光年之外”以后创办的新公司。OneDiff 是硅基流动的第一款产品,本次我们有幸邀请到 OneDiff 的作者姚迟来进行现场分享。OneDiff 对图像生成模型的加速有很好的效果。


2. 生态工具分享嘉宾来自英飞流和腾讯徐云向量数据库团队。在很多应用场景里大模型要获得良好的效果,需要一些工具的辅助。比如,数据预处理工具,应用流程编排框架,向量数据库等等。英飞流创始人金海,曾经是全球首个开源向量数据库 Milvus 的研发负责人,带领团队经历了 Milvus 项目从零到一的构建过程。英飞流目前有两个开源项目:Infinity(开源 AI 原生数据库)和 RAGFlow(开源 RAG 流程框架)。老金将和我们分享他对 AI 原生数据库的新认知。向量数据库虽然被大模型带火,但一直以来面临很多争议。一则是向量搜索能力的必要性,会不会被大模型的长文本能力给卷没了;二则是向量搜索功能有没有必要做成单独的产品。随着 ChatGPT 新功能的发布,向量搜索的重要性我想是没人怀疑了。对于重要功能值不值得做个单独的产品,依然还会有一个见仁见智的时期。向量数据库的支持方目前还是有不少好消息的。在海外,据悉美国的向量数据库厂商 Pinecone 已经达到了一千五百万美元 ARR 的收入水平;OpenAI,X-AI 都选择在产品中使用向量数据库(据闻是 qdrant);硅谷团队 ChromaDB 凭借与 Langchain 的合作,以及良好的易用性在短时间内收获了大量用户,在一些 AI 应用平台的统计中独占鳌头。在国内,腾讯云向量数据库产品近期开始正式计费了。这说明腾讯云向量数据库产品已经完成了早期的市场探索,开始进入商业化阶段。本次我们邀请到了腾讯云向量数据库产品经理邹鹏来进行分享。

3. 数据数据对大模型的训练至关重要。这一点从美国创业公司 Scale AI 的高歌猛进可见一斑。这方面确实是我不熟悉的,所以我很期待现场听听整数智能创始人林群书的分享。

本次活动会进行线上直播,但还是鼓励有条件的朋友来线下参会。因为我们会留出足够的时间来给大家进行现场交流。