日期: 2024-06-10 类型:智能硬件
为此,产业家对国内主流AI应用做了一些盘点与梳理。希望在洞察行业前沿趋势的同时,也为把握未来的AI应用格局提供一个重要窗口。
“猛增至91万、涨幅高达264%、34倍”这一数据来自GitHub 上的AI开源项目统计对比。
那么,截止如今,国内的AI应用到底有哪些?分布在哪些方向和领域?以及它们具体的能力到底如何?
统计来看,AI 应用按应用领域可大致分为通用软件、工具型应用、行业软件、智能硬件四大类。在通用软件市场,生成式 AI 在办公软件、客户服务、IT 运维、软件开发、网络安全、数据智能等应用已经率先落地,并已确定进入商业化的前期,主要赛道上均有标杆产品出现。
而由于 AI智能助理(Coplilot)可以将 AI 的能力深入嵌入具体应用场景中,能够主动理解使用者的意图并提供成型的方案,成为了国内通用生成式 AI 应用最广泛的产品形态。协同办公领域基于其先天优势,AI应用落地较多。
工具型AI应用最重要的包含聊天机器人、搜索引擎、文本工具、AI 作画以及代码工具等,大多分布在在 C 端。
值得注意的是,由于其高度依赖底层大模型。竞争优势的构建,大多数来源于差异化的产品定位,以及持续训练更强大的底层模型和算法,所以,目前国内工具类AI应用的同质化程度较高。
行业软件涉及金融、医疗、教育、工业、游戏、法律等多个行业,生成式AI 在游戏、法律、教育、电商等 C 端场景有较多的结合,而在医疗、金融、工业等 B 端场景下生成式 AI 产品的成熟度仍然偏低。目前,主要是金融、医疗、教育等头部厂商着重打造垂类大模型推动相关应用落地。
智能硬件包括智能汽车、机器人、智能终端等,目前生产式 AI 与智能硬件的结合大致上可以分为两个方面。
一是语音助手,应用场景包括智能座舱、智能音箱、家用机器人等各类智能终端。另一类则为数字代理 AI Agent,主要使用在包括无人驾驶、智能机器人等,具备更加广阔的应用空间。不过,目前 AI Agent 在感知与决策能力上仍存在瓶颈。
总体来看,AI应用的整体发展势头尚处于初级阶段。这一点,透过一级市场的投资动态也可见一斑。
据CB Insights多个方面数据显示,到2023年第二季度为止,生成式AI领域的总投资额相较去年全年的25亿美元暴增4.6倍,尽管其中大约70%的投资资金集中在包括大型模型在内的底层AI基础设施建设,应用层的融资占比仅为三成。
就当下而言,一个值得思考的问题是,AI应用究竟行至何处?通用型、工具型、行业型、硬件型都有哪些?为此,产业家对国内主流AI应用做了一些盘点与梳理。希望在洞察行业前沿趋势的同时,也为把握未来的AI应用格局提供一个重要窗口。
功能方面,钉钉AI应用提供了内容生成与摘要,能够自动生成长文档、会议记录、聊天摘要等内容概览,明显提高信息处理效率;二是智能助手服务,包括但不限于AI写真、涂鸦作画、法律助手等功能,服务于个人用户及企业的多样化需求;三是工作流程的优化。通过AI优化协同办公流程,如智能排程、任务自动化处理等,降低人力成本;四是应用生成与扩展。基于AIPaaS平台,可快速生成新的AI驱动应用或增强现有应用的功能。
接入能力上,钉钉AI应用通过统一接口与各类AI服务紧密结合,实现跨应用的一体化交互。并允许第三方开发者和合作伙伴基于钉钉AI PaaS平台开发适配自家业务的AI应用,形成共生共赢的生态环境。
目前钉钉AI应用已经在多个关键办公环节实现智能化自动化操作,减少人工干预,提升工作效率;可以依据用户行为和偏好进行一定程度的个性化推荐和定制服务;能够实时响应用户需求,提供决策辅助数据,帮助企业更好地进行管理和决策。
飞书智能助手MyAI能够自动汇总会议纪要,通过自然语言处理技术准确记录并整理会议重点内容,同时还可以创建各类报告,如日报、周报、月报等,大大减轻人工撰写负担。并实现了文档处理、信息管理与提取、业务洞察与流程管理以及组织洞察与赋能的智能化。
例如支持自动续写和生成文档、表格、邮件、思维导图、问卷等多元化的创作需求;具备业务洞察能力和业务流程管理能力,为企业提供决策支持和流程自动化方案等。
接入能力方面,用户可以直接在飞书App中通过对话形式与My AI互动,完成创建日程、查询信息、发起任务等操作。同时,飞书AI可以与其他应用程序和服务无缝集成,例如可通过集简云这样的平台将其AI助手功能接入到飞书机器人中,实现各种自动化工作流。企业还可以根据自身需求选择不同的AI底层模型,赋予飞书智能伙伴更高的定制性和适应性。
目前,飞书AI已成功应用于多个办公场景,包括但不限于会议管理、文档处理、内部信息检索、任务创建与跟踪、流程自动化等,有着较实用的办公辅助能力。
功能方面,腾讯会议AI应用运用先进的音频处理技术,能有效过滤背景噪音,消除回声,确保会议清晰流畅;通过人脸识别技术,实现参会人员身份验证,并能实时统计参会人数,提高会议的安全性和管理效率;会议过程中,AI能够实时将语音转换成文字,生成会议纪要,方便后续回顾和整理。还支持智能翻译、智能推荐等能力。
为了方便企业将其与自有系统或其他第三方软件进行集成,腾讯会议开放了API接口和SDK,实现会议预约、管理、统计等功能的自动化和个性化定制。并实现跨平台兼容,与与腾讯生态融合。
目前,腾讯会议AI应用已经在提高会议效率、简化操作流程、增强会议体验等方面取得显著成果,尤其在疫情期间,成为远程办公、在线教育的重要支撑工具。
WPS AI能够基于用户的输入或对话交互,自动生成各类文档,比如文章、简历、报告、邮件等,用户可以指定文档的样式、内容结构等要素。并且具备、处理文档、归纳总结、汇总整合能力。
除此之外,WPS AI还包含约100多项AI应用,涉及办公场景的各种生产力提升,如智能排版、智能图表制作、智能审阅、智能检索、智能问答等。
接入能力方面,WPS AI已经成功接入到WPS的文字处理、表格、演示文稿(PPT)、PDF阅读器等全线产品中,实现了无缝整合;WPS AI也接入了一站式数字办公平台WPS 365,为企业客户提供智能化办公工具,实现企业文档管理和协同工作的智能化升级。
目前,WPS AI采用了大语言模型技术,能够理解和生成自然语言,模拟人类进行复杂文本创作和编辑任务。且WPS AI已经面向全体用户逐步开放体验,意味着其技术成熟度和稳定性足以应对大规模用户群体的使用需求。
百度如流采用AI技术来改善会议体验,例如提供AI洞察功能,可以实时提炼议题、关键观点和发言摘要;同时,AI会议纪要能自动生成并结构化展示会议内容,支持多维度筛选和检索,大大提高会议产出的利用率。并在知识管理、沟通协同、智能报销、搜索与推荐方面提供完备的AI能力。
接入能力方面,百度如流提供API接口和SDK,使得企业能够将其与其他内部系统、业务流程甚至第三方应用进行深度集成,实现工作流程自动化和一体化管理;支持多终端接入,无论是在桌面端还是移动端,都能保持一致的高效办公体验;可以与企业邮箱、日程、项目管理等多种企业服务工具进行对接,实现企业级服务的全面覆盖。
目前百度如流AI应用已经实现了从企业沟通、协作、知识管理到行政事务处理等全方位的智能化改造,显著提升了企业工作效率和员工满意度。其AI技术已深入到日常工作场景的各个环节,包括但不限于智能写作、编码辅助、语音识别、噪声抑制等。
功能方面,AI智能助手可帮助用户根据提供的关键词、问题或者简要提纲,快速生成各类文档、文章、报告等内容,减轻用户的创作负担。同时提供智能编辑、智能总结、智能PPT、文档检索与推荐等能力。
AI助手并不是一个独立的App,而是集成在应用程序中,用户可以直接在App内使用AI功能,无需额外下载和配置。
关于是否对外开放API接口,公开信息未明确提到。但考虑到百度在AI领域的布局,可能存在针对企业和开发者开放的部分功能接口,允许第三方接入和集成到其他系统或平台中。
目前,AI智能助手基于文心一言模型的强大语义理解和生成能力,能够处理复杂的自然语言任务,提供高度连贯且具有一定创造性的文本输出;用户可以实时与AI助手交互,获取即时的文档创作支持和服务;对于大规模文档库的管理和处理能力较强,能够帮助用户更高效地管理、搜索和创建文档资源。
综合上述信息,AI应用已经具备相当高的智能化水平,尤其在文档创作、编辑和管理方面提供了强大的AI赋能功能。
讯飞听见可以实现实时或非实时的高质量语音转文字服务,准确率高,适用于会议记录、讲座、电话会议、访谈等各种场合的录音转写;能够自动整理会议内容,提炼出关键要点,生成结构化的会议纪要,甚至可以自动生成会议摘要和待办事项;支持多种语言的语音转文字,包括但不限于中英文互译,适用于国际会议或跨国沟通场景。
还可以利用AI算法进行内容分析,提供全文摘要,方便用户快速掌握内容核心;讯飞听见会议提供了AI赋能的云视频会议协作平台,实现高清视频通信的同时,还能够自动记录会议内容并整理成会议纪要。
接入能力方面,讯飞听见支持PC端、移动端等多种设备接入,有相应的网页版、桌面客户端和移动应用版本;开放API接口和SDK,允许第三方开发者将其语音转写功能集成到各类业务系统和应用中;还能够与讯飞自家或合作品牌的智能硬件设备无缝对接,提高语音采集和转写效率。
目前讯飞听见采用先进的AI技术,如基于大模型的语音识别引擎“星火认知大模型”,极大地提升了语音转文字的准确性和智能性。已经广泛应用在企业办公、远程教育、法庭庭审、记者采编、影视后期制作等多个实际场景中,助力工作效率提升。
用户只需输入一段自然语言描述,文心一格即可依据描述内容生成对应的高质量图像,实现了从文本到视觉艺术作品的转换。还可以按照每个用户需求生成不同风格的画作,包括但不限于国画、油画、水彩画、插画、动漫等多元风格。
文心一格不仅可以描绘具体的实物,还能理解抽象概念和情感色彩,赋予作品一定的艺术想象力和创新性。
接入能力方面,文心一格提供了Web应用程序,用户可以直接访问官方网站使用该服务。具有对外提供API的能力,但具体是否开放API供第三方开发者接入尚待验证。
文心一格采用了百度自主研发的大规模预训练模型,在生成图像的质量和创意上达到了较高水准,能较好地理解和诠释用户的文本描述。由于其便捷性和创新性,文心一格可以广泛应用于艺术创作、设计素材生成、个性化广告制作、教育辅助等多个领域。
文心一格作为一款AI绘画工具,目前已经在基于文本描述的图像生成领域取得了突破性进展,可以满足用户多样化的图像创作需求。
Dreamina能够根据用户输入的文字描述生成对应的创意图片,允许用户只需输入文本即可创造出多样化的图像内容,涉及不同风格、色彩和元素;用户还能对生成的图片进行一系列的编辑和调整,如更改尺寸、比例、模板,甚至细化到对图片元素的增删、颜色变化和位置调整等,大大提高了创作自由度和个性化表达的可能性。
剪映系列产品的特点是通常具有良好的跨平台支持,Dreamina很可能也能够在手机、电脑和iPad等多种设备上使用,方便用户随时随地进行创作。目前并未开放给企业级用户。
目前,Dreamina已经实现了较高的自动化水平,能基于用户的输入生成高质量的艺术作品,减少了传统图像创作所需的手动绘图或素材搜集步骤。Dreamina能够生成富有创意和想象力的作品,突破人类创作者单一视角的限制,为用户提供更多元化的创作灵感来源。
功能方面,用户只需上传少量照片,妙鸭相机即可借助AI技术生成高质量的写真照片。
FaceChain/FaceChain-FACT算法可使得的妙鸭相机生成的面部表情自然、细节丰富。
目前,妙鸭相机凭借其AI图像生成技术,在市场上迅速走红。从用户反馈来看,妙鸭相机在照片生成的质量、速度和智能化方面都有较高的水平,能满足消费者对低成本高质量照片的需求。
PixVerse AI能接受包括图像、文本和音频在内的多种数据源作为输入,基于这些输入生成连贯、逼真的视频内容;该平台能在较短时间内将用户提供的素材转化成视频,极大提高了视频制作的效率;且生成的视频不仅局限于简单的转译,还能具有较高的艺术性和创造性,适合用于制作营销视频、社交媒体内容、教育材料等多种应用场景;用户可以根据自身需求对生成的视频进行某些特定的程度的个性化设置和调整。
截止至2024年3月初,PixVerse AI能够实现高度自动化和智能化的视频创作流程,显著提升视频生产的效率和创意表达的可能性。
豆包AI具有强大的自然语言处理和理解能力,可以与用户进行流畅且富有个性化的对话,提供问答、智能创作等功能,支持文本和语音输入输出,增强了用户体验的多元性。且具有视觉识别和人脸识别能力,这意味着它可以基于视觉信息进行互动,例如识别用户和物体,从而提供更为情境化和个性化的服务。
豆包作为一款AI工具,能与多种终端设备无缝对接,允许用户在不同平台上使用其功能,而且能利用抖音及其他字节系产品的庞大用户群和数据资源进行拓展和优化。
目前,豆包已经达到了较为成熟的AI对话助手阶段,不仅能提供基本的文字交流,还能通过视觉和语音技术增强交互的真实感。能够处理多种任务,从日常闲聊到专业咨询,再到个性化内容生成,覆盖范围广泛。不过,根据提及的信息,豆包AI尚未具备直接生成图片的能力,这可能是其未来迭代升级的一个方向。
京言AI能够提供关于各类商品的专业知识解答,帮助消费者了解不同品类的商品特点、选购要点等,比如如何挑选智能马桶、乳胶床垫等。此外,还提供个性化推荐、个性化送礼助手、产品对比助手、购物经验知识分享等能力。
京言AI已无缝接入京东商城APP中,用户直接在APP内部就能获取AI服务。京言AI支持文本和语音两种输入方式,使得用户可以根据个人习惯便捷地与AI互动。还接入京东的大数据资源,利用机器学习和自然语言处理技术,分析用户行为,提供个性化服务。
目前,京东京言AI助手已经能够完成基本的商品查询、推荐、对比等任务,并在实际应用场景中提供了较为准确的信息咨询服务;在智能对话方面,京言AI能处理大多数常见的购物相关问题。
阿里小蜜能够解答用户在淘宝、天猫等平台购物过程中,包括商品咨询、订单状态查询、退换货政策、物流跟踪等服务问题。利用自然语言处理技术和大数据分析,可以自动化解决大部分常见问题,快速响应用户的询问,并提供准确的答案。此外还提供个性化服务、上下文理解与推荐、一站式服务、服务管家等能力。
接入能力方面,阿里小蜜可通过多种途径接入,包括但不限于手机淘宝、天猫APP、支付宝等阿里系产品的内嵌聊天窗口,甚至通过电话语音交互;对于商家或合作伙伴而言,小蜜还提供了API接口和SDK工具包,方便将其智能客服功能集成到自身的网站或移动应用中。
目前阿里小蜜已经具备较高水平的人工智能应用能力,不仅能高效处理海量的用户咨询,还能提供较为复杂的个性化和智能化服务,成为电商平台乃至更广泛应用场景下的重要智能服务工具。
“光子”能够串联通用工具链和针对金融行业的插件工具,这意味着它可以整合各种金融相关的数据处理、分析和决策支持功能;光子还具备强大的自然语言处理能力,能理解并回应用户在金融业务中的各种复杂问题和需求,提供专业的金融服务咨询。
另外,通过接入金融机构的业务系统,光子可以帮助自动化执行一些常规的、规则性强的后台操作,如账户管理、交易处理、报告生成等,提高工作效率,减少人为错误。
利用AI算法,光子还能够对海量金融数据进行深度挖掘和智能分析,为金融机构提供实时的投资策略建议、风险预警和业务优化方案。
接入能力方面,光子具备良好的系统集成能力,可以无缝对接金融机构现有的IT基础设施,包括但不限于CRM系统、ERP系统、交易平台等,实现数据的互联互通。
目前,恒生电子推出的光子系列大模型产品已正式进入市场并得到应用。针对金融行业各细分领域(如银行、证券、保险、基金等)的不同业务场景进行定制化适配,满足多样化的业务需求。光子基于金融行业大模型LightGPT的能力进行全面升级,可以在投顾、客服、运营等多个业务环节提供更加智能和精准的服务。
医联AI医生(MedGPT)具有强大的智能诊断能力,可对近3000种疾病进行首诊判断,诊断结果与三甲医院医生的诊断一致性高达96%,能够提供初步的病情分析和诊疗建议。
此外其还具备多模态学习与分析、病例讨论与学习、医疗知识库与更新、慢病管理与健康咨询等能力。
接入能力方面:医联AI医生可与医疗信息系统(HIS)、电子病历系统(EMR)、远程医疗平台等无缝对接,实现数据共享和实时交互。还能够接入线上线下的医疗服务场景,包括互联网医院、实体医疗机构、家庭医生签约服务等。
目前医联AI医生通过不断学习和迭代,持续优化诊断准确性和服务效能,已具备较为完善的医疗诊断辅助功能,能够在实际医疗场景中发挥重要作用,减轻医生的工作负担,提升诊疗效率。
功能方面,小P老师能够为不同年龄段的学生提供从幼儿教育到高中教育阶段全学科的教学支持,包括但不限于语文、数学、英语、科学等课程的答疑解惑和知识点讲解。
还可以提供个性化教学、智能交互与答疑、学习资源推荐、学习数据跟踪与分析等功能。
接入能力方面,小P老师作为一款AI应用,具有较好的平台兼容性,可接入不同操作系统(如Windows、iOS、Android)上的设备,如PC、平板电脑和智能手机等。小P老师还能够与网易有道教育平台及其它教育产品无缝对接,比如有道词典、有道精品课等,实现数据共享和功能互补。同时,可以接入外部优质教育资源,包括教材出版社、在线课程平台、教育机构等,为用户提供丰富的学习资源。
目前,小P老师已经可以自动组织学习内容,进行知识点梳理和专题讲解,让学生在互动学习过程中享受个性化教学体验。此外,在深度学习与自适应学习以及课堂互动与情境模拟逐步深入。
总结来说,网易AI家庭教师“小P老师”已经具备了较为完善的智能教学功能和良好的系统接入能力,通过深度学习和大模型技术,可以为广大学生提供个性化的、全时段的在线学习支持。
小爱同学能通过语音识别技术和自然语言处理技术,与用户进行流畅的对话交流,理解并执行用户的指令;可以控制各种智能家居设备,如小米及其生态链产品的智能电视、空调、灯光、扫地机器人、智能插座等,实现家居智能化管理;提供新闻播报、天气预报、日程提醒、闹钟设置、时间查询、汇率转换、股票信息、路况查询、限行提醒等功能;还能提供在线教育、儿童故事等教育资源。
此外,还能基于用户的使用习惯和偏好,逐渐学习并提供更为个性化的服务,比如智能推荐音乐、新闻等。
接入能力方面,小爱同学不仅能在小米自家设备上运行,还能通过手机APP或其他软件平台接入,操控不同品牌和类型的智能设备。同时与小米IoT生态系统紧密结合,可以接入大量小米及合作伙伴生产的智能硬件设备。
目前,小爱同学运用深度学习和自然语言处理技术,语音识别率较高,能够应对复杂的语音指令和连续对话。随着版本迭代和技术进步,小爱同学已经实现了自然连贯的语音对话、男性语音版本等高级功能,以及AI电话助手等创新服务。
总的来说,小爱同学作为一款AI智能应用,在用户体验和功能拓展上达到了较高的水平,不仅能提供基础的生活便利服务,还能有效整合和控制整个智能家居生态系统,体现出了较强的接入能力和实用性。
功能上,用户可以通过自然语言与天猫精灵进行对话,实现各种指令的传达,例如播放音乐、电台节目,查询天气、新闻、交通信息等;还在天猫超市和其他合作平台上购买商品,并且通过声纹识别技术进行支付确认,简化购物流程。
接入能力上,天猫精灵AI平台对外开放API和SDK,允许第三方开发者为其开发“技能”,即扩展应用,形成庞大的生态系统,支持更多的智能设备和服务接入。
且能够与多种IoT(物联网)设备无缝集成,支持多种通信协议,实现跨品牌、跨品类的智能家居设备互联互通。
不仅整合了阿里巴巴集团内部的丰富资源,还与众多外部合作伙伴达成内容和服务上的合作,让天猫精灵成为连接多元服务的入口。
目前,天猫精灵已具备较高的智能水平和广泛的接入能力。值得注意的是,随着AI技术的发展,天猫精灵可能正在研发或考虑如何整合更高级的自然语言处理和生成技术,以进一步提升其对线、毫末智行 自动驾驶
功能上,毫末智行提供从L2-L4级别的自动驾驶解决方案,包括城市道路、高速公路等复杂场景下的自动驾驶功能,如城市NOH(Navigation on Highway)系统,实现无图导航辅助驾驶,支持城市道路中的自动变道、避障、路口通行等功能。
接入能力方面,毫末智行的AI技术已经成功应用于长城汽车等主机厂的多款车型,表明其具备与汽车制造商的高度集成能力,能够将自动驾驶系统无缝接入到整车电子电气架构中。
目前,毫末智行的自动驾驶技术已经实现了商业落地,不仅在乘用车市场中获得了数百万辆级的装车量,还在智能物流、无人配送等领域开展应用,在AI应用方面已形成了较为完整的技术体系和商业化布局。
通过引入AI技术,企业能够优化生产流程、预测维护需求、自动控制生产线,从而大幅提高生产力和运营效率。例如,在制造业中,AI助力智能制造,实现精密质量控制和资源优化配置。
AI技术还促使产品向智能化方向发展,无论是消费电子产品、家用电器还是工业设备,都逐渐融入AI元素以提升用户体验和价值。同时,AI也使得传统产品服务形态发生转变,形成“产品+服务”、“硬件+软件”的新组合。
AI驱动的产品研发也更加依赖于数据分析和模型模拟,设计师和工程师能够借助AI工具进行快速原型设计、仿真测试和迭代优化。此外,AI还能帮企业进行市场需求预测、产品创新设计以及个性化定制,促进产品差异化竞争。
此外,还带动产业结构转型升级。例如,农业领域的精准种植、养殖,服务业的智能客服、个性化推荐系统等,都在很大程度上体现了AI技术的赋能作用。
总而言之,尽管当前AI还未实现科幻电影中的全自主思考和行动,但它确实在实实在在地改变着我们的生产和生活方式,默默地推动经济社会的创新发展。
未来,随着百度文心大模型、阿里通义大模型、智谱ChatGLM大模型等先进技术的迭代升级,我们预期AI将在更多领域内催生出真正的“原生应用”,即从底层架构开始就深度融合人工智能技术的应用程序。
这类应用不仅将深度学习、自然语言处理、计算机视觉等AI模块作为核心组件,还将构建起全新的交互模式和应用场景,使AI真正成为驱动应用功能和服务创新的核心引擎。