主要研究兴趣包括:工业物联网大数据、智能运维等。2012年获得教育部自然科学二等奖(第三完成人)。主持或主要参与科技部重点研发计划、国家青年973、自然科学重点 面上基金、上海市科委、上海市经信委的多个项目,以及华为、微软、IBM等企业的资助项目。在数据库领域顶级国际期刊和会议SIGMOD、VLDB、ICDE、TKDE等发表论文40多篇。担任众多国际学术会议的程序委员会委员,包括SIGKDD、ICDE、DASFAA、WAIM等。国际学术期刊VLDB Journal、TKDE、KIS等的审稿人。
众安保险基础技术负责人,负责众安保险云与基础设施建设、信息安全、工程效能。
随着云计算的发展与企业应用的逐步深入,对云的讨论也从上云,转到用云、用好云上,云计算在企业的应用步入深水区。
近两年,行业故障频发,技术圈掀起了一股“下云”讨论的热潮,对跨云、混合云的讨论也日渐增多。企业到底应该如何选择?上云?下云?跨云?
众安保险作为一家100%生长在云上的互联网保险企业,本次分享将结合众安在云计算技术应用上的实践,来探讨这些话题。
本次分享包含以下内容:
1、要不要下云?
2、众安FinOps实践;
3、要不要跨云?
4、金融行业跨云样本;
5、浅谈云的未来。
10年以上Oracle数据库技术支持、运维管理经验,支持过的数据库超1000套,长期为大型企业核心业务系统数据库提供方案设计、性能优化、故障处理、应急容灾、安装配置等技术服力。在15年的数据库项目管理实践过程中积累了丰富的实战经验,包括:全球最大的OLTP系统与OLAP系统数据库设计维护经验,16个RAC集群大规模数据库系统设计维护经验,500公里以上ACTIVE DATAGUARD数据库容灾系统规划实施经验,各种疑难杂症问题处理经验,各种平台版本数据库维护、优化经验等,在性能优化、规划设计、故障处理、安装配置等技术领域有自己独到的见解和处理经验。
5+年专注于 AIOps领域,从监控、应急到变更、容量领域的风险防控、效率提升、成本节约,具体项目涉及弹性容量、变更防控、智能告警等,10+篇相关专利,在ICSE、SoCC等顶会发表多篇论文。目前主要从事LLM + Ops方向,包括Ops垂类大模型以及结合Agent的产品应用
随着ChatGPT等大模型的火热, 通用类大模型在面向Ops这种专业、严谨、私有领域如何落地?大模型的出现对于Ops是个概念, 还是能解决原有小模型时代无法解决的问题?大模型存在的事实问答、数据时效、数值计算、领域任务等能力薄弱如何解决?本次分享将会带来蚂蚁集团OpsGPT垂类大模型落地实践和开源技术的分享,包含Ops垂类评测构建、Ops垂类模型构建和结合Agent、EKG等技术的落地实践。
1、LLM + Ops如何有机结合;
2、企业如何构建自己垂类LLM大模型。
数字时代的思考者和践行者,热衷于在企业发展的不同阶段,通过数字科技(人工智能、大数据、云计算、交互、分析等)与商业价值的优化整合,创新、赋能企业可持续发展。 在二十多年的职业生涯中,在全球范围内服务过金融、生产制造、医疗健康、生命科学、信息通信技术(ICT)、消费品、 自然资源、物流配送等行业。
人寿保险与AI赋能面临的机遇与挑战
AI赋能基本框架 - 人寿保险渠道业务与AI相关能力构成
AI赋能产品简介 - 细分赋能场景与产品形态
我们的一些思考 - 问题域及其求解空间
随着ChatGPT的问世,大型模型在全球范围内引发了一场关于研究与应用的热潮。这些模型无论是在单模态的语言处理还是多模态的处理场景中,都展现了非常强的理解、记忆、推理和生成能力。本次演讲,许坤老师将从快手搜索的业务场景出发,介绍近一年在利用大模型提升搜索用户体验以及开拓新的业务场景方面所做的探索,包括如何构建智能搜索问答、情感陪伴能力。在演讲中,他讲分享上述过程中的所遇到的难点问题以及相关的技术突破。
阿里云钻石布道师, 被评为“中国信通院2023可观测性领域”年度专家。 阿里云可观测AIOps负责人,负责可观测AIOps建设、智能运维大模型的探索等。 主导了AIOps产品Insights的关键能力建设,包括构建了APM领域的检测和故障定位模型,提升了异常检测的准确率至95%以上,故障定位的准确率至87%以上。带领ARMS入选2022“Gartner APM与可观测”魔力象限, 获得2023信通院“根因分析技术”先进级认证,等。 本科毕业于南京大学信息工程系。博士毕业于新加坡国立大学电子计算机系, 期间研究方向主要为智能传感系统、信号处理等。
大模型以其出色的推理和涌现能力,为精确的数据关联和问题诊断提供了新途径。阿里云可观测团队利用大模型强化了AIOps,通过Promql/SQL生成的方案, 实践了自然语言驱动数据查询的流程。 此外, 通过Agent和异常检测、诊断tool的联合, 我们尝试了更自然的ChatOps场景,提高了机器人在告警发生后的故障诊断效率和“说人话”的能力。尽管引入大模型带来了解释性和“幻觉”挑战,但ReAct等框架的提出了新的解决方案。展望未来,大模型将继续为AIOps技术发展注入创新,发挥关键作用。同时, 围绕着大模型及其应用提供的可观测能力,也将成为新的蓝海方向。
1、大模型之前, AIOps是如何解决监控运维领域的问题的, 特别是, 是如何做异常发现和根因诊断的?
2、 大模型出现后, 我们观察到给可观测领域带来了哪些新的机会和挑战?
3、大模型给AIOps模型带来的影响和变化。
拥有十多年运维开发经验,现供职于京东科技架构师,负责智能运维平台研发。
主要介绍京东科技智能运维AIOps平台的整体能力和落地场景具体实践分享。
1、如何从传统运维进化到智能运维?
2、智能运维体系如何建设?
3、京东科技智能运维平台核心功能和具体实践;
4、如何基于大模型构建运维大模型?
工商银行金融科技研究院云计算创新实验室AIOps智能运维及云原生智能算力方向架构师及技术负责人,牵头并参与智能投产验证平台、故障诊断与处理平台、企业级日志中心、PaaS云平台等多个重点项目的开发与建设。带领团队负责工商银行AI+云原生前瞻性研究及研判,并牵头工商银行以业界首批、同业首家通过信通院“智能化运维(AIOPs)能力成熟度”评估,且获得业界最高等级(第三级)认证。
在云原生时代,随着云计算、微服务等技术的广泛运用,系统更新迭代速度不断加快,运维数据规模爆炸式增长,传统的运维方式越来越无法满足7×24小时稳定可靠运行的要求。为实现运维架构的转型升级,工商银行紧跟业界AIOps发展趋势,以“数据+技术”双要素为驱动,整合优势开发资源研究攻关,从0到1构筑了云原生智能运维平台,提供涵盖故障管理、变更管理、成本管理、运维支持四大类运维管理新模式能力的AIOps智能运维服务,全面推进运维智能化转型。
1、故障管理;
2、变更管理;
3、成本管理;
4、运维支持。
民生银行数据库架构师 ,负责基础软件智能运维平台。拥有10+年金融行业数据库运维经验,6+年智能运维平台开发建设经验。目前致力于发展智能运维、云原生、自主可控等数据库技术创新和落地。
探讨当前AI技术与数据库的结合场景,分享AI4DB的实践案例,思考DB4AI的定位,最后对大模型时代的展望。
1. 介绍目前主流的一些AI4DB功能场景:异常检测、多指标关联、参数调优与诊断、索引推荐、慢SQL根因分析、趋势预测、慢SQL发现、SQL语句改写、智能优化器等;
2. 分享AI4DB场景落地实践经验:数据库指标异常检测、数据性能容量趋势预测、数据库指标关联关系挖掘、数据库画像、数据库日志检测、数据库异常sql挖掘、数据库索引推荐;
3. DB4AI的思考与实践:DB承接AI算法和模型(不推荐)、DB承接AI数据存储和加工(推荐);
4. 大模型时代展望:(1)成熟场景:知识问答、日志分析、告警分析;(2)演进目标:智能运维机器人。
10年以上的SolarWinds IT运维产品经验,拥有丰富的技术支持、运维管理、产品管理的经验,长期为中国区众多客户提供优质的解决方案。
如何应对当今复杂的IT混合环境的运维管理?如何通过AI驱动的智能运维平台实现自动化运维提高企业生产竞争力以及节约人力和物力的成本?
1、数字化转型的旅程错综复杂,缺乏端到端的可见性;
2、面对众多且复杂的运维平台,如何高效的数据统一化;
3、如何通过AI驱动智能运维平台实现高效简洁的自动化运维。
负责全集团数据库数字化转型全链路技术支撑工作,兜底解决厂商无法解决的棘手技术问题。负责核心系统数据库国产化分布式数据库技术攻坚,实现金融行业深度绑定Oracle特性、海量核心系统数据库国产化首次里程碑突破,为推进行业数据库架构变革、国产数据库生态繁荣做出突出贡献,中国太保集团信创数据库解决方案在工信部组织的“赛宝优秀信创解决方案”评选中获奖;自研国产数据库改造工作量预评估工具“指南针”,弥补业界空白,提升应用改造效率约25%,累计节省成本超千万。合著《PostgreSQL考试认证指南》,《金融电子化》发表多篇文章;获得OceanBase OBCE、Oracle OCM、Postgresql PCM、MySQL OCP认证;获得人民银行颁发科技发展奖。
1、重负载批处理CPU瓶颈优化方法论;
2、高并发CPU瓶颈优化方法论;
3、IO瓶颈优化方法论;
4、全链路故障定位方法论;
5、运维优化实战案例。
硕士研究生学历,曾就职于蚂蚁金服。擅长领域:云计算IAAS和PAAS平台规划与建设、系统架构设计、API治理、一体化运维平台建设以及DevSecOps等。ITIL认证,并在IEEE Computer发表论文” on-demand security architecture”,发表专利“一种数据保护方法、装置及数据保护系统”(专利号:201010538235 8),“业务系统容量运营分析管理方法、装置、存储介质及设备”(专利号:ZL 2023 1 0958572 X),软著“FinOps数字化IT容量运营分析平台”(登记号:2023SR1043733)。零信任产业标准工作组成员,基金行业信息安全白皮书编者成员,DevOps Master认证等。
近些年,FinOps的实践在国内外日趋成熟,本项目正是基于招商基金的内部需求以及外部成熟技术,以构建“数据+算法+场景”的高价值服务型数据资产为指引,落地了一套完整的以业务系统为中心的FinOps数字化IT容量运营分析平台,从2023年5月上线,截止2023年底,直接成本加间接成本共计约92.5万元加10人月左右,并完成软著一篇、专利一篇。
1、FinOps能给企业降本增效带来什么收益?
2、FinOps在实施过程中应该如何进行以及注意事项是什么?
3、FinOps的场景应该如何构建?
云平台架构师,数据库技术爱好者,多年数据库运维以及平台建设经验。目前负责Vivo数据库平台研发,个人工作专注于数据库运维提效,可靠性工程建设,成本优化,AIOPS等方向。
随着当前企业IT系统中包含的数据库种类日渐增多以及数据库实例规模的不断增长,数据库平台建设逐渐变成数据库运维的必由之路。本次分享将从数据库可靠性,运维提效,成本优化,数据隐私4个方向介绍vivo数据库平台的建设历程,以及行业各种新技术背景下的一些平台建设探索和思考。
1、 威胁数据库可用性的因素有哪些?
2、数据库各类运维任务提效有没有通用的关键钥匙?
3、从0到1建设数据库平台功能又如何着手?
毕业于浙江大学与德国斯图加特大学,2020年加入浙江移动,致力于业支系统稳定性保障。主导革新故障抢修协调、应急预案演练等多项SRE工作体系,实现公司系统故障数与影响时长连续下降;参与杭州亚运等重大事件保障,获“中国移动浙江公司岗位能手(IT工程师)”、“亚运保障先进个人”等称号。
浙江公司结合自身多年AIOPS运维经验,引入信息技术中心自主研发的深瞳智维大模型,基于该产品的“聚智”智能体开发协作框架及多智能体交互能力,逐步形成具备浙江特色的“大小模型联动”的新一代故障无人驾驶智能体,聚焦于“深检”和“智驾”两大能力,进一步缩短系统MTTR。
1、 SRE体系如何与大模型结合?
2、如何利用大模型缩短故障响应时间?
3、运维大模型实践路径有哪些?
本科毕业于北京大学,博士毕业于中国科学院大学计算技术研究所,研究方向为分布式图计算。毕业后长期从事分布式系统相关研究工作,近两年专注于分析型数据库与向量检索相关方面的工作,目前火山引擎ByteHouse团队负责向量搜索相关功能开发。
向量检索被广泛使用于以图搜图、内容推荐以及大模型推理等场景。随着业务升级与 AI 技术的广泛使用,用户期望处理的向量数据规模越来越大,对向量数据库产品的稳定性、易用性与性能需求也越来越高。为此我们基于社区 ClickHouse 进行技术演进,提出了全新的向量检索功能设计思路,满足业务对向量检索稳定性与性能方面的需求。
1、向量检索概念以及在 LLM 场景的应用;
2、当前业界向量数据库发展情况;
3、ClickHouse 结合向量检索的优势,以及社区当前向量检索局限性与性能问题分析;
4、ByteHouse 向量检索功能设计思路介绍;
5、性能比较。
快手基础架构团队技术专家,带领图数据库研发团队,产出高性能分布式图数据库KGraph,服务于快手各业务线。本人曾就职于腾讯,在海量服务、大数据和存储领域有超过十年的技术积累。
业界各大互联网公司相继推出了自己的图数据库,并在业务中得到了越来越广泛的应用,本次演讲针对快手自研的高性能分布式图数据库KGraph,主要分为两部分:第一部分是架构相关,主要介绍KGraph和其他数据库的异同点和技术架构,在技术架构演进过程中的迭代和思考;第二部分是业务应用相关,主要介绍基于KGraph的应用场景,在应用KGraph之后取得的成果,以及图数据库所适用的场景说明。
1、什么是图数据库,图数据库是否可以应用到我的业务场景?
2、图数据库的架构是怎样的,对我的系统架构设计是否有一些启发?
前饿了么、蚂蚁金服技术专家,现任货拉拉数据库部门负责人,负责货拉拉全球化业务场景下整体数据库、消息队列、缓存、数据库中间件的稳定性建设工作 主持过饿了么数据库异地多活建设,对数据库库中间件、分布式数据库和自动化运维平台设计开发有丰富的实践经验。