找回密码
 立即注册

微信扫码 , 快速开始

查看: 422|回复: 0

对话微软亚洲研究院边江博士:如何推动大模型在工业场景落地 ...

[复制链接]

340

主题

-7

回帖

1487

积分

管理员

积分
1487
发表于 2024-5-6 18:18:31 | 显示全部楼层 |阅读模式
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          来源:周到上海       作者:苗夏丽
  “虽然大家经常讨论的是聊天机器人(10.710, 0.24, 2.29%)或情感陪伴助手这些应用,但实际上,我们现在能看到大模型在工业领域有更多的落地场景,大模型的应用场景非常广泛。”
  近日,微软亚洲研究院资深首席研究员、微软亚洲研究院机器学习组和产业创新中心负责人边江博士接受记者采访时说,大模型已经可以用于能源领域的电能产量预测,或者医疗领域的患者监测预测。
  “这些时序预测任务,在大模型中都有很好的落地场景,尽管目前还没有太多人深入讨论。”边江说,“我们通过相关研究,并对一些技术增强了大模型的预测能力,包括决策能力。”
  边江分享了一个解决供暖和空调系统中的能源消耗问题的创新解决方案,实时分析外部天气情况和建筑内部人流量的变化,实时调整空调设备的送风温度和送风压力,能源使用效率提升,能源消耗减少达30%。
  这个被称为“可优化HVAC控制策略的强化学习”的技术,近日也在上海气候周期入选2024年十大值得关注的气候技术。
  “这个算法的本质,其实是为了优化长期的收益,来调整当前的决策。比如,空调系统可能每隔15分钟或1小时就需要重新设定,这些设置不仅影响当前的温控效果,还会影响到空调的长期能耗。强化学习需要处理的就是这种时序决策问题,即如何做出既考虑当前影响又优化长期收益的决策。”边江说,当然这里面临的一个主要挑战是环境动态变化。
  “当时,我们在公司总部大楼测试这个算法,正好赶上加州的山火,这种大范围的自然灾害,显著影响了美国西海岸的气候,这类突发事件是我们以前没有遇到过的挑战。我们也设计了能够适应这些复杂环境的算法,让它做得更好。”边江说,与当年AlphaGo处理的围棋环境不同,围棋的环境是静态且封闭的,而HVAC系统则需要应对每天变化的气候和不同的室内人员变动。
  据了解,对于预测的算法,主要涉及两种类型,一是时序预测,比如面向糖尿病患者,可以基于每五分钟一次的血糖监测数据,预测其未来血糖的变化,这属于时序数据的预测。另一种非时序数据的预测,即结构化的表格数据,比如金融行业中用于检测欺诈行为或反洗钱等。
  “根据我们目前的研究,大模型在这些预测任务上具有很大的潜力,通过对现有大模型的微调,我们可以赋予它这种预测能力。”边江说,它可以用于能源领域的电能产量预测,或者医疗领域的患者监测预测。
  “这些时序预测任务在大模型中也有很好的落地前景,尽管目前还没有太多人对此有深入探讨。我们已经进行了相关研究,并通过一些技术增强了大模型的预测能力,包括决策能力。”
  此前刚刚在上海结束的F1中国大奖赛,不少车队也都融入了高科技。“车手应该在哪一圈进站更换轮胎,应该选择换哪种类型的轮胎……”边江说。
  据了解,F1赛车有三种不同的轮胎:软胎、中性胎和硬胎。软胎尽管可以短时间内获得快速圈速,但无法坚持太多圈,磨损较快;硬胎耐磨但圈速不如软胎快;中性胎则介于两者之间。这根据比赛情况决策何时进站、换胎,以及换什么类型的胎。同时进站策略也很关键,它取决于当前车手的赛道位置,比如是否处于比较拥挤的赛段,或者出站后是否会遇到慢车等情况,这些都是重要的决策点。因为每圈都要决定这一圈要不要让车手进站。
  ”整个决策过程是一个时序决策的过程,通过一套强化学习算法,并结合大数据模型生成数据,这一整套框架应用能够于F1赛车的场景。”边江说,在方程式赛车中,该基础模型能够优化赛车的轮胎维修策略,根据赛车轮胎的损耗和维修成本,找到最佳的进站维修时间,以缩短赛程、提高赛车排名。
  边江也表示,“我们已将大模型与强化学习结合,使其能够提供高质量的离线数据,帮助学习泛化性很强的策略。
  对于大模型在产业落地过程中的成本问题,边江认为,考虑成本时,不同的角度会有不同的应对策略。
  “站在微软的角度,我们可以为客户提供不同成本的解决方案。比如预测类的任务,可以将其作为一种云服务进行提供,这种模式特别适合中小企业,他们不需要自行处理大规模数据,只需收集几个、几十个样本,就能利用我们的大模型,通过“上下文学习”(in context learning),实现有效的预测。”
  在边江看来,另一个平衡成本的例子是采用基于检索增强生成(RAG)的方法进行知识管理,这也是大模型落地的很好的场景。
  “我们已与物流公司合作处理海关通关的知识管理,以及与医药公司合作进行FDA审批的知识管理中使用了这样的方式。这种方法的优点在于,企业不需要自己训练大模型,只需调用我们提供的大模型API,并结合RAG进行知识管理,就可以达到很好的效果。RAG是在已有的大模型基础上进行增强,通过添加外部知识库来实现更好的行业知识管理。”边江说。
  据了解,微软近期发布了一个小模型Phi-3。小模型的优势是计算量的需求少,对于没有大模型算力的公司,小模型既可以作为补充,也因为较低的能耗而具有优势,不是所有任务都需要大模型。小模型也是微软研究院预测的今年的AI重点的研究方向之一。
                                                                                                                                                                                                                                                                                                    
                海量资讯、精准解读,尽在新浪财经APP
            
                                                                        责任编辑:江钰涵

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|博士驿站:连接全球智慧,共创博士人才生态圈 ( 浙ICP备2023018861号-3 )平台提供新鲜、免费、开放、共享的科技前沿资讯、博士人才招聘信息和科技成果交流空间。 平台特别声明:线上内容(如有图片或视频亦包括在内)来自网络或会员发布,均已备注来源;本站资讯仅提供信息和存储服务。Notice: The content above (including the pictures and videos if any) is uploaded and posted by user , which is a social media platform and only provides information storage services.

GMT+8, 2024-11-23 19:43

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表