我國的數(shù)據(jù)挖掘技術現(xiàn)狀分析論文
摘要:數(shù)據(jù)挖掘學科的出現(xiàn), 是對計算機領域的補充, 在計算機領域的發(fā)展下發(fā)展迅速, 引起了國內的重視, 并在國家的大力促進下不斷發(fā)展, 取得了階段性的成就, 但是發(fā)展現(xiàn)狀仍然不容樂觀, 本篇文章將針對數(shù)據(jù)挖掘的定義以及國內的現(xiàn)狀進行分析, 并對其發(fā)展趨勢進行預測, 目的在于加快我國的數(shù)據(jù)挖掘技術研究進程。
關鍵詞:數(shù)據(jù)挖掘; 中國; 現(xiàn)狀; 發(fā)展;
0 引言
隨著計算機的發(fā)展與數(shù)據(jù)量的增加, 其對于數(shù)據(jù)的處理技術如生成、收集、儲存數(shù)據(jù)等的水平要求越來越高, 因此新型的數(shù)據(jù)挖掘技術的出現(xiàn)是必然趨勢, 替代了傳統(tǒng)落后的數(shù)據(jù)處理技術。我國對于數(shù)據(jù)挖掘技術的研究已經(jīng)取得矚目的效果, 但是應用程度不高, 提高數(shù)據(jù)挖掘技術的實際應用成為了主要的問題, 需要采取必要措施加快數(shù)據(jù)挖掘技術應用進程。
1 數(shù)據(jù)挖掘的定義
數(shù)據(jù)挖掘 (DM) 是一個新興的學科, 學名叫做數(shù)據(jù)庫中發(fā)現(xiàn)知識 (KDD) , 其出現(xiàn)在20世紀90年代, 并在這三十年間發(fā)展迅速, 它的主要工作領域為數(shù)據(jù)庫系統(tǒng)以及數(shù)據(jù)庫應用領域, 其作用在于能夠從應用數(shù)據(jù)中提取隱藏的關鍵信息與知識, 應用數(shù)據(jù)的范圍廣泛, 不管是不完整的數(shù)據(jù), 還是受干擾的數(shù)據(jù), 數(shù)據(jù)挖掘技術都能夠通過對其數(shù)據(jù)的轉換分析或者模塊化處理進行識別與篩選, 并提取和處理其中的有用信息。數(shù)據(jù)挖掘的目的在于通過對數(shù)據(jù)中信息的處理, 篩選關鍵數(shù)據(jù), 發(fā)現(xiàn)被忽略的數(shù)據(jù), 從而尋找數(shù)據(jù)中的規(guī)律, 為決策者提供合理科學的數(shù)據(jù)分析報告, 幫助其作出最優(yōu)化的決策。
數(shù)據(jù)挖掘技術學科的本質在于加深對數(shù)據(jù)的使用層次, 挖掘數(shù)據(jù)的內在含義并進行抽象化的概括, 改變了以往數(shù)據(jù)只能簡單查詢的低級層次。數(shù)據(jù)挖掘具有先知性、實用性以及科學性的特點, 同時數(shù)據(jù)挖掘的發(fā)展依賴于數(shù)據(jù)庫、人工智能統(tǒng)計學等計算機學科的快速發(fā)展, 因此吸引了一大批專業(yè)人才加入到其的研發(fā)過程中, 加快了其的研究發(fā)展進程。
2 數(shù)據(jù)挖掘在中國的現(xiàn)狀分析
2.1 研究現(xiàn)狀分析
我國開展數(shù)據(jù)挖掘技術的研究在1993年, 中科院合肥分院成為首個被自然科學基金支持進行數(shù)據(jù)挖掘技術研究, 從此以后, 我國掀開了研究數(shù)據(jù)挖掘研究的序幕, 主要研究機構與人員主要是相關專業(yè)的大學教授以及一些數(shù)據(jù)處理研究機構。近年來, 我國對數(shù)據(jù)挖掘的研究工作高度重視, 通過中國自然科學基金等對其進行資金支持, 同時, 政府創(chuàng)立“九五”計劃以及“863”計劃對其提供政策支持。
數(shù)據(jù)挖掘的研究引起了我國相關專業(yè)的人才的廣泛關注, 并在全國范圍內掀起了研究數(shù)據(jù)挖掘知識技術的'理論與實際應用的熱潮, 其中包括高等學府與科研機構。例如:對于數(shù)據(jù)挖掘技術的算法計算與改造研究是復旦大學與華中理工大學等高校的研究方向, 非結構化數(shù)據(jù)知識的網(wǎng)頁數(shù)據(jù)挖掘技術是南京大學的主要研究方向, 而科研機構如北京系統(tǒng)工程研究院來說, 其主要研究方向是數(shù)據(jù)挖掘技術在模糊信息中的實際應用。
2.2 應用現(xiàn)狀分析
在我國, 能夠真正應用數(shù)據(jù)挖掘技術并取得成就的公司包括是廣州華工明天科技有限公司以及菲奈特-融通企業(yè), 其中廣州華工明天科技有限公司主要進行多功能數(shù)據(jù)挖掘設備的研發(fā), 而菲奈特-融通企業(yè)依賴于數(shù)據(jù)挖掘軟件的發(fā)展進行其商業(yè)智能套件的研發(fā)。
2.3 研究成果分析
近年來, 由于國家的大力扶植與資金支持, 我國數(shù)據(jù)挖掘技術研究取得了重要性的成果, 在亞太數(shù)據(jù)挖掘的國際會議中, 由南京大學周志華帶隊的數(shù)據(jù)挖掘技術研究小組表現(xiàn)突出, 同時參與數(shù)據(jù)挖掘編程大賽并奪得桂冠;同樣在了亞太數(shù)據(jù)挖掘國際會議上, 中國香港大學的電子商業(yè)科技研究院的黃哲學教授的論文獲得亞太數(shù)據(jù)挖掘國際會議論文大獎。
2.4 國內外對比
國內外的數(shù)據(jù)挖掘技術研究的進程具有很大的差距, 不僅表現(xiàn)在相關理論的研究上, 更在于對數(shù)據(jù)挖掘技術的實際應用的方面。與國外的數(shù)據(jù)挖掘技術研究進程相比, 我國的研究起步晚, 仍然處于發(fā)展的初級階段, 并且還沒有成熟的理論與技術應用成果, 目前的主要研究方向是對于數(shù)據(jù)的初級處理如模糊化處理, 技術尚不成熟。
國外關于數(shù)據(jù)挖掘技術的軟件研發(fā)發(fā)展已經(jīng)取得矚目的成就, 而國內的軟件研發(fā)尚不成熟, 研究的重心在于高等學府的人才, 同時都是屬于政府資助項目, 可能導致其成果要求較低, 從而阻塞了研發(fā)的步伐。
3 數(shù)據(jù)挖掘在我國的未來發(fā)展
3.1 研究方向展望
近年來, 隨著計算機科學領域的快速發(fā)展, 數(shù)據(jù)挖掘技術作為一種新興的學科, 其研究熱度正在逐漸升溫, 研究的水平也在逐步提高, 同時由于政府的政策支持與資金支持, 越來越多的數(shù)據(jù)專業(yè)研究者被吸引加入其中。在數(shù)據(jù)挖掘技術未來的研究過程中, 其主要方向應包括以下幾點:
(1) 參照于SQL語言的標準化的研究成果, 對數(shù)據(jù)挖掘技術進行形式化的描述, 即發(fā)現(xiàn)數(shù)據(jù)語言。 (2) 為實現(xiàn)關于數(shù)據(jù)額挖掘技術人機交互工作的順利開展, 應滿足用戶對知識發(fā)現(xiàn)過程的可視化進程。 (3) 研究在計算機領域的數(shù)據(jù)挖掘技術的發(fā)展, 可以通過數(shù)據(jù)挖掘服務器的有效配合的方式實現(xiàn)。
3.2 面臨的問題
(1) 挖掘方法與人機交互問題。我國數(shù)據(jù)挖掘技術的發(fā)展受限制于挖掘方法, 不管是知識類型的限制, 還是維度上的限制, 都是影響其發(fā)展的重要因素。 (2) 性能問題。能夠有效的解決數(shù)據(jù)挖掘技術算法中的問題是解決其性能問題的關鍵, 應對其有效性、可伸縮性等問題進行研究, 保證其算法能夠滿足用戶的性能要求。 (3) 數(shù)據(jù)類型多樣性問題。對于算法復雜的, 多維度的數(shù)據(jù)類型, 現(xiàn)有的研究水平很難去解決此類問題, 同時對于多跨度的全球化信息技術的挖掘水平仍然落后。
4 結束語
數(shù)據(jù)挖掘技術作為新興的數(shù)據(jù)應用工具, 能夠有效的加強對數(shù)據(jù)的處理程度, 但是由于我國研發(fā)起步晚, 導致我國的發(fā)展水平落后與國外水平。近年來, 國家對數(shù)據(jù)挖掘技術的政策與資金支持, 掀起了研究的熱潮。我國應重視數(shù)據(jù)挖掘算法研究以及其實際應用, 不斷地發(fā)展數(shù)據(jù)挖掘技術的研究。
參考文獻
[1]謝邦昌, 李揚.數(shù)據(jù)挖掘與商業(yè)智能的現(xiàn)況及未來發(fā)展[J].統(tǒng)計與信息論壇, 2015 (05) :94-96.
[2]李菁菁, 邵培基, 黃亦瀟.數(shù)據(jù)挖掘在中國的現(xiàn)狀和發(fā)展研究[J].管理工程學報, 2016 (03) :10-15.
【我國的數(shù)據(jù)挖掘技術現(xiàn)狀分析論文】相關文章:
分析在課程教學中數(shù)據(jù)挖掘技術的選擇論文10-15
大數(shù)據(jù)自動分析與數(shù)據(jù)挖掘探討的論文11-28
數(shù)據(jù)挖掘論文03-31
我國預算績效管理現(xiàn)狀分析論文12-01
專利數(shù)據(jù)挖掘的論文06-26