展會(huì )信息港展會(huì )大全

2023愛(ài)分析.數據科學(xué)與機器學(xué)習平臺廠(chǎng)商全景報告 | 愛(ài)分析報告
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-02-15 15:14:13   瀏覽:10234次  

導讀:本報告對數據科學(xué)與機器學(xué)習平臺市場(chǎng)進(jìn)行重點(diǎn)研究,面向金融、消費品與零售、制造與能源、政府與公共服務(wù)等行業(yè)企業(yè),以及人工智能軟件與服務(wù)提供商的數據部門(mén)、業(yè)務(wù)部門(mén)負責人,通過(guò)對業(yè)務(wù)場(chǎng)景的需求定義和代表廠(chǎng)商的能力評估,為企業(yè)數據科學(xué)與機器學(xué)習平...

本報告對數據科學(xué)與機器學(xué)習平臺市場(chǎng)進(jìn)行重點(diǎn)研究,面向金融、消費品與零售、制造與能源、政府與公共服務(wù)等行業(yè)企業(yè),以及人工智能軟件與服務(wù)提供商的數據部門(mén)、業(yè)務(wù)部門(mén)負責人,通過(guò)對業(yè)務(wù)場(chǎng)景的需求定義和代表廠(chǎng)商的能力評估,為企業(yè)數據科學(xué)與機器學(xué)習平臺的建設規劃、廠(chǎng)商選型提供參考。

廠(chǎng)商入選標準

本次入選報告的廠(chǎng)商需同時(shí)符合以下條件:

2. 廠(chǎng)商全景地圖

愛(ài)分析基于對甲方企業(yè)和典型廠(chǎng)商的調研以及桌面研究,遴選出在數據科學(xué)與機器學(xué)習市場(chǎng)中具備成熟解決方案和落地能力的入選廠(chǎng)商。

3. 市場(chǎng)分析與廠(chǎng)商評估

愛(ài)分析對本次數據科學(xué)與機器學(xué)習平臺項目的市場(chǎng)分析如下。同時(shí),針對參與此次報告的部分代表廠(chǎng)商,愛(ài)分析撰寫(xiě)了廠(chǎng)商能力評估。

數據科學(xué)與機器學(xué)習平臺

市場(chǎng)定義:

數據科學(xué)與機器學(xué)習平臺是指覆蓋數據采集、數據探索、數據處理、特征工程、模型構建、模型訓練、模型部署與發(fā)布、模型管理與運營(yíng)等建模全流程的平臺,提供一站式建模服務(wù),能顯著(zhù)提升建模效率、降低建模門(mén)檻。

甲方終端用戶(hù):

金融、消費品與零售、制造與能源、政府與公共服務(wù)等行業(yè)企業(yè),以及人工智能軟件與服務(wù)提供商的數據科學(xué)家、風(fēng)控建模人員、營(yíng)銷(xiāo)建模人員、業(yè)務(wù)分析人員、模型應用人員

甲方核心需求:

企業(yè)對機器學(xué)習的應用越來(lái)越廣泛。一方面,數據量的激增、算法的突破以及CPU、GPU、DPU等多種算力技術(shù)的發(fā)展,為以機器學(xué)習為基礎的數據挖掘、計算機視覺(jué)、自然語(yǔ)言處理、生物特征識別等技術(shù)在企業(yè)的應用奠定了技術(shù)基礎;另一方面,市場(chǎng)環(huán)境的快速變化對企業(yè)決策敏捷性要求增強,不僅推動(dòng)企業(yè)將機器學(xué)習模型應用到營(yíng)銷(xiāo)、廣告、風(fēng)控、生產(chǎn)等更多業(yè)務(wù)場(chǎng)景,也對模型精度、模型開(kāi)發(fā)敏捷性以及模型應用廣度提出更高要求。然而,機器學(xué)習技術(shù)門(mén)檻高、建模周期長(cháng),難以滿(mǎn)足企業(yè)通過(guò)基于機器學(xué)習模型提升經(jīng)營(yíng)效率的需求。

數據科學(xué)與機器學(xué)習平臺具備工具豐富集成、建模效率提升以及模型資產(chǎn)復用等特點(diǎn),能充分滿(mǎn)足企業(yè)對智能應用的需求,正成為企業(yè)智能化基礎設施的必要構成。

不同企業(yè)對數據科學(xué)與機器學(xué)習平臺的需求不同,其差異取決于企業(yè)自身機器學(xué)習建模能力和對算法的需求。

1、對于金融、消費品與零售、制造與能源、政府與公共服務(wù)等行業(yè)企業(yè)

除大型金融機構外,傳統企業(yè)普遍不具備機器學(xué)習建模能力。大型金融機構數據科學(xué)團隊人才完善,對機器學(xué)習算法的探索和應用更前沿,如將機器學(xué)習模型應用在精準營(yíng)銷(xiāo)、智能風(fēng)控、產(chǎn)品研發(fā)、客戶(hù)體驗管理等多個(gè)場(chǎng)景中。但更多的傳統企業(yè)面臨IT人才缺失、尚未開(kāi)始智能化應用或處于局部試驗的初期階段。傳統企業(yè)對數據科學(xué)與機器學(xué)習平臺的需求主要體現在以下四個(gè)方面:

1)降低機器學(xué)習建模門(mén)檻,使非專(zhuān)業(yè)建模人員也能掌握機器學(xué)習建模技術(shù),賦能業(yè)務(wù)。傳統機器學(xué)習建模技術(shù)門(mén)檻高,需要組建專(zhuān)門(mén)的數據科學(xué)團隊,包括數據工程師、數據科學(xué)家、開(kāi)發(fā)工程師等,人力成本高昂。傳統企業(yè)希望能降低機器學(xué)習建模門(mén)檻,如平臺能實(shí)現數據自動(dòng)處理、自動(dòng)特征工程、圖形化建;蜃詣(dòng)建模等功能,使非專(zhuān)業(yè)的業(yè)務(wù)人員也能快速開(kāi)展建模工作,廣泛賦能業(yè)務(wù),實(shí)現普惠AI。

2)提供定制化算法、模型部署和運營(yíng)服務(wù),快速創(chuàng )造業(yè)務(wù)價(jià)值。傳統行業(yè)多具備行業(yè)特性,行業(yè)垂直場(chǎng)景下的模型開(kāi)發(fā)耗時(shí)耗力,而且傳統企業(yè)對AI智能應用的探索尚處于初期,更傾向“小步快跑”,因此購買(mǎi)定制化算法能節約人力、實(shí)現快速產(chǎn)出以及驗證AI智能應用效果。企業(yè)需要廠(chǎng)商提供定制化算法服務(wù)、模型在硬件平臺和操作系統平臺的部署服務(wù)以及模型運營(yíng)服務(wù)。

3)縮短建模周期,提高業(yè)務(wù)敏捷響應度。以金融行業(yè)為例,金融企業(yè)的產(chǎn)品、服務(wù)、風(fēng)控模型均需隨著(zhù)客戶(hù)行為改變而持續迭代更新。但傳統的機器學(xué)習建模周期長(cháng)達數月,無(wú)法敏捷響應業(yè)務(wù)需求。企業(yè)需要數據科學(xué)與機器學(xué)習平臺內置豐富的行業(yè)算法、模型模板、案例等,供建模人員直接調用,加速模型訓練;或是提供一鍵部署功能,實(shí)現模型在生產(chǎn)環(huán)境的快速部署。

4)提供咨詢(xún)服務(wù),提升模型質(zhì)量。對于具備一定機器學(xué)習建模能力的金融機構,需要廠(chǎng)商提供建模咨詢(xún)支持,協(xié)助企業(yè)完成數據準備、模型訓練、模型部署等環(huán)節,提升模型質(zhì)量。

2、對于人工智能軟件與服務(wù)提供商

對于中小企業(yè)或是剛開(kāi)始試點(diǎn)智能應用的企業(yè),相較于數據科學(xué)與機器學(xué)習平臺需要的組織、人才、流程上的變革與支持,采購適用于特定場(chǎng)景的AI智能應用是性?xún)r(jià)比更高、更迅捷的解決方案。人工智能軟件與服務(wù)商如算法服務(wù)商、ISV即面向此類(lèi)需求,提供模型和智能應用服務(wù)。以算法服務(wù)商為例,盡管具備專(zhuān)業(yè)的數據科學(xué)團隊,但中小型企業(yè)的算法需求多樣且個(gè)性化,如雖然都是AI視覺(jué)算法,智慧城市、智慧工業(yè)下的應用場(chǎng)景如安全帽識別、產(chǎn)品瑕疵識別的模型卻截然不同,需要基于業(yè)務(wù)數據集、業(yè)務(wù)思路分別進(jìn)行訓練。這使得算法服務(wù)商常常面臨嚴格的算法交付周期和算法精度要求。具體而言,人工智能軟件與服務(wù)提供商對數據科學(xué)與機器學(xué)習平臺的核心需求主要體現在以下四個(gè)方面:

1)提高機器學(xué)習建模效率。軟件開(kāi)發(fā)公司、算法提供商面臨嚴格的交付周期,但在傳統AI應用開(kāi)發(fā)方式下,數據接入、數據處理、模型訓練等一系列建模流程都需要人工操作,建模周期長(cháng)。其中數據接入環(huán)節因開(kāi)源算法工具對不同類(lèi)型的數據兼容性較差,需人工將原始數據轉化為開(kāi)源算法所支持的數據類(lèi)型;數據標注環(huán)節往往通過(guò)人工完成,并且部分領(lǐng)域的標注過(guò)程嚴重依賴(lài)專(zhuān)業(yè)知識,整體數據準備將耗費數周時(shí)間;模型部署中對模型的集成、監控和更新需要大量的調研和實(shí)施工作,單個(gè)模型部署到上線(xiàn)需要3-5個(gè)月。企業(yè)需要完善的數據科學(xué)工具和建模功能,支持實(shí)現數據采集、數據準備、特征工程、模型訓練、模型部署等建模全流程,提高建模效率。

2)滿(mǎn)足數據科學(xué)家復雜場(chǎng)景建模需求。平臺需支持數據科學(xué)家在復雜場(chǎng)景下進(jìn)行靈活建模,如提供豐富的算法,預置主流機器學(xué)習框架,支持NoteBook建模方式,以及支持數據科學(xué)家在模型訓練中手動(dòng)調參等。

3)對模型開(kāi)發(fā)資源和計算資源進(jìn)行統一管理,支持計算資源彈性擴容,加速建模計算性能。傳統開(kāi)發(fā)模式中重復建設嚴重,如各項目數據準備、特征工程、模型訓練等各自研發(fā),造成模型開(kāi)發(fā)管理資源、計算資源浪費,難以適應大規模智能應用開(kāi)發(fā)需求。另外,機器學(xué)習模型訓練過(guò)程中耗費大量計算資源,而一旦結束訓練,計算資源又處于閑置狀態(tài)。企業(yè)需要實(shí)現計算資源彈性擴容,滿(mǎn)足模型開(kāi)發(fā)不同階段的計算需求。

4)為多角色的數據科學(xué)團隊提供協(xié)作平臺。機器學(xué)習建模過(guò)程需要數據工程師、數據科學(xué)家、數據分析師等多角色共同協(xié)作完成,存在反復溝通、協(xié)作流程不明確等問(wèn)題,帶來(lái)重復性工作。

廠(chǎng)商能力要求:

為滿(mǎn)足金融、消費品與零售、制造與能源、政府與公共服務(wù)等行業(yè)企業(yè),以及人工智能軟件與服務(wù)提供商等甲方客戶(hù)的核心需求,廠(chǎng)商需具備以下能力:

1、廠(chǎng)商應具備完善的機器學(xué)習模型開(kāi)發(fā)功能,提供包括數據采集、數據準備、特征工程、模型訓練、模型部署等功能在內的一站式端到端數據科學(xué)與機器學(xué)習平臺。

1)數據采集方面,平臺應具備整合多源異構數據的能力,支持實(shí)時(shí)接入結構化數據和非結構化數據(如表格、圖片、時(shí)間序列數據、語(yǔ)音和文本等),并具備基本的ETL能力、數據實(shí)時(shí)更新和同步能力。

2)數據準備方面,平臺應提供豐富的數據清洗、數據探索工具。其中數據清洗環(huán)節,應能支持進(jìn)行數據融合、數據缺失處理、數據分類(lèi)、數據標注、數據異常處理、數據平滑以及整合非結構化數據和結構化數據等數據清洗工作,減少人工干預。數據探索環(huán)節,廠(chǎng)商需具備單變量和多變量統計、聚類(lèi)分析、地理定位圖、相似度度量等分析能力。

3)模型訓練環(huán)節,針對非專(zhuān)業(yè)建模人員,平臺應提供簡(jiǎn)便易用的建模工具,降低機器學(xué)習建模門(mén)檻。如平臺可通過(guò)建模全流程可視化降低用戶(hù)使用門(mén)檻,尤其在模型構建環(huán)節,應支持以拖拉拽的方式完成建模。針對專(zhuān)業(yè)建模人員,平臺應具備較高的靈活性和開(kāi)放性,提供主流開(kāi)源算法和建模工具。如為專(zhuān)業(yè)的數據科學(xué)家提供自由靈活的NoteBook建模方式,并預置主流機器學(xué)習框架R、TensorFlow、Pytorch、Spark等,以及豐富的機器學(xué)習算法。

4)模型部署環(huán)節,平臺應支持模型一鍵部署,使建模人員可快速將模型從開(kāi)發(fā)環(huán)境部署到生產(chǎn)環(huán)境中,并提供API接口供業(yè)務(wù)人員調用。此外,平臺還應提供模型版本管理和模型監控功能,實(shí)時(shí)監測模型性能,保證模型質(zhì)量。

5)資源管理方面,平臺需能對CPU、GPU資源進(jìn)行管理和整合,以容器化方式對算力虛擬化,實(shí)現彈性擴容、性能加速等功能,且不同部門(mén)和項目之間可共享集群資源。

6)平臺應具備AutoML能力,包括提供數據自動(dòng)清洗、智能標注、自動(dòng)特征工程和自動(dòng)模型訓練等功能,提高建模效率。其中特征工程環(huán)節,數據科學(xué)與機器學(xué)習平臺應能實(shí)現自動(dòng)化特征構建、特征選擇、特征降維和特征編碼;模型訓練環(huán)節,平臺應支持自動(dòng)化模型選擇、自動(dòng)化調參、自動(dòng)化超參數搜索、模型自動(dòng)驗證等,減少模型訓練時(shí)間成本和人力成本。

7)此外,平臺還應支持多角色的數據科學(xué)團隊協(xié)作,協(xié)同數據工程師、數據科學(xué)家、業(yè)務(wù)人員等不同角色在建模工作流程中的模型注解、討論、答疑、評論等,使建模過(guò)程可追溯、模型可復用,減少重復性工作。

2、廠(chǎng)商需具備垂直行業(yè)Know-how能力,為企業(yè)提供咨詢(xún)和實(shí)施部署服務(wù)。廠(chǎng)商的專(zhuān)業(yè)服務(wù)能力體現在三個(gè)方面:一方面,基于豐富的垂直行業(yè)知識和經(jīng)驗積累,廠(chǎng)商能為用戶(hù)提供行業(yè)場(chǎng)景相關(guān)的算法、模型模板,或是將行業(yè)經(jīng)驗與模型算法相結合,形成諸如精準營(yíng)銷(xiāo)、智能推薦、反欺詐、設備預警等智能業(yè)務(wù)模型,供用戶(hù)直接調用;另一方面,廠(chǎng)商能提供建模咨詢(xún)服務(wù),通過(guò)數據科學(xué)專(zhuān)家團隊規劃有效的模型應用到特定業(yè)務(wù)的運營(yíng)方案,協(xié)助用戶(hù)完成數據準備、模型訓練、模型部署、模型運營(yíng)等工作,以及將企業(yè)既有的數據集經(jīng)驗、特征工程經(jīng)驗、模型經(jīng)驗等提煉形成數字資產(chǎn),內嵌到平臺中。此外,廠(chǎng)商應具備較強的實(shí)施部署能力,包括提供定制化模型算法在硬件平臺和操作系統平臺的部署服務(wù)、以及數據科學(xué)與機器學(xué)習平臺的部署服務(wù)。

入選標準:

1.符合市場(chǎng)定義中的廠(chǎng)商能力要求;

2.2021Q3至2022Q2該市場(chǎng)付費客戶(hù)數量≥10個(gè);

3.2021Q3至2022Q2該市場(chǎng)合同收入≥1000萬(wàn)元;

代表廠(chǎng)商評估:

百分點(diǎn)科技

廠(chǎng)商介紹:

北京百分點(diǎn)科技集團股份有限公司(簡(jiǎn)稱(chēng)“百分點(diǎn)科技”)成立于2009年,是領(lǐng)先的數據科學(xué)基礎平臺及數據智能應用提供商,圍繞智慧政務(wù)、公共安全、數字產(chǎn)業(yè)三大業(yè)務(wù)板塊,為國內外企業(yè)和政府客戶(hù)提供端到端數智化解決方案。

產(chǎn)品服務(wù)介紹:

百分點(diǎn)數據科學(xué)基礎平臺圍繞數據價(jià)值增值過(guò)程,提供數據融合治理、數據建模與知識生產(chǎn)、知識應用三大工具集,覆蓋從數據集成、數據治理、數據建模、數據分析到數據服務(wù)的完整數據價(jià)值鏈條。其中數據建模環(huán)節,內置機器學(xué)習平臺,能一站式、可視化地實(shí)現數據準備、特征工程、模型開(kāi)發(fā)與訓練、模型部署與發(fā)布、模型管理等機器學(xué)習建模全流程,幫助企業(yè)快速構建數據分析、語(yǔ)義分析、語(yǔ)音分析以及視覺(jué)分析應用。

廠(chǎng)商評估:

百分點(diǎn)機器學(xué)習平臺能實(shí)現一站式、可視化機器學(xué)習建模全流程管理,具備高效的數據預處理、豐富的模型服務(wù)能力。此外,百分點(diǎn)科技具備完善的數據建模上下游數據科學(xué)工具,能幫助用戶(hù)實(shí)現“數據知識應用”閉環(huán),并在智慧公安、應急管理、客戶(hù)體驗管理等領(lǐng)域沉淀豐富行業(yè)經(jīng)驗,能為用戶(hù)提供端到端解決方案。

典型客戶(hù):

中旅中免、應急管理部、北京市公安局、北京市統計局

贊助本站

人工智能實(shí)驗室
相關(guān)內容
AiLab云推薦
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗室 版權所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責聲明 | 隱私條款 | 工作機會(huì ) | 展會(huì )港