前言:本站為你精心整理了電子商務數(shù)據(jù)管理范文,希望能為你的創(chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
[摘要]企業(yè)的競爭優(yōu)勢并不取決于信息的擁有量,而是取決于信息的處理利用能力。如何化信息優(yōu)勢為競爭優(yōu)勢,是企業(yè)制勝于市場的一個法寶。本文論述了一種信息處理利用的有效工具——數(shù)據(jù)挖掘方法及其在電子商務中的應用。
[關鍵詞]數(shù)據(jù)挖掘方法電子商務應用
隨著網(wǎng)絡技術和數(shù)據(jù)庫技術的成熟,傳統(tǒng)商務正經(jīng)歷一次重大變革,向電子商務全速挺進。這種商業(yè)電子化的趨勢不僅為客戶提供了便利的交易方式和廣泛的選擇,同時也為商家提供了更加深入了解客戶需求信息和購物行為特征的可能性。數(shù)據(jù)挖掘技術作為電子商務的重要應用技術之一,將為正確的商業(yè)決策提供強有力的支持和可靠的保證,是電子商務不可缺少的重要工具。
一、何謂數(shù)據(jù)挖掘及方法
確切地說,數(shù)據(jù)挖掘(DataMining),又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase,KDD),是指從大型數(shù)據(jù)庫或數(shù)據(jù)倉庫中提取隱含的、未知的、非平凡的及有潛在應用價值的信息或模式。它融合了數(shù)據(jù)庫、人工智能、機器學習、統(tǒng)計學等多個領域的理論和技術。比較典型的數(shù)據(jù)挖掘方法有關聯(lián)分析、序列模式分析、分類分析、聚類分析等。它們可以應用到以客戶為中心的企業(yè)決策分析和管理的各個不同領域和階段。
1.關聯(lián)分析。關聯(lián)分析,即利用關聯(lián)規(guī)則進行數(shù)據(jù)挖掘。關聯(lián)分析的目的是挖掘隱藏在數(shù)據(jù)間的相互關系,它能發(fā)現(xiàn)數(shù)據(jù)庫中形如”90%的顧客在一次購買活動中購買商品A的同時購買商品B”之類的知識。
2.序列模式分析。序列模式分析和關聯(lián)分析相似,但側重點在于分析數(shù)據(jù)間的前后序列關系。它能發(fā)現(xiàn)數(shù)據(jù)庫中形如”在某一段時間內,顧客購買商品A,接著購買商品B,而后購買商品C,即序列A→B→C出現(xiàn)的頻度較高”之類的知識,序列模式分析描述的問題是:在給定交易序列數(shù)據(jù)庫中,每個序列是按照交易時間排列的一組交易集,挖掘序列函數(shù)作用在這個交易序列數(shù)據(jù)庫上,返回該數(shù)據(jù)庫中出現(xiàn)的高頻序列。在進行序列模式分析時,同樣也需要由用戶輸入最小置信度C和最小支持度S。
3.分類分析。設有一個數(shù)據(jù)庫和一組具有不同特征的類別(標記),該數(shù)據(jù)庫中的每一個記錄都賦予一個類別的標記,這樣的數(shù)據(jù)庫稱為示例數(shù)據(jù)庫或訓練集。分類分析就是通過分析示例數(shù)據(jù)庫中的數(shù)據(jù),為每個類別做出準確的描述或建立分析模型或挖掘出分類規(guī)則,然后用這個分類規(guī)則對其他數(shù)據(jù)庫中的記錄進行分類。
4.聚類分析。聚類分析輸入的是一組未分類記錄,并且這些記錄應分成幾類事先也不知道,通過分析數(shù)據(jù)庫中的記錄數(shù)據(jù),根據(jù)一定的分類規(guī)則,合理地劃分記錄集合,確定每個記錄所在類別。它所采用的分類規(guī)則是由聚類分析工具決定的。采用不同的聚類方法,對于相同的記錄集合可能有不同的劃分結果。
應用數(shù)據(jù)挖掘技術,較為理想的起點就是從一個數(shù)據(jù)倉庫開始,數(shù)據(jù)挖掘可以直接跟蹤數(shù)據(jù)并輔助用戶快速做出商業(yè)決策,用戶還可以在更新數(shù)據(jù)的時候不斷發(fā)現(xiàn)更好的行為模式,并將其運用于未來的決策當中。
二、據(jù)據(jù)挖掘在電子商務中的應用
數(shù)據(jù)挖掘能發(fā)現(xiàn)電子商務客戶的的共性和個性的知識、必然和偶然的知識、獨立和關聯(lián)的知識、現(xiàn)實和預測的知識等,所有這些知識經(jīng)過分析,能對客戶的消費行為如心理、能力、動機、需求、潛能等做出統(tǒng)計和正確地分析,為管理者提供決策依據(jù)。具體應用如下:
1.分類與預測方法在電子商務中的應用。在電子商務活動中,分類是一項非常重要的任務,也是應用最多的技術。分類的目的是構造一個分類函數(shù)或分類模型,通常稱作分類器。分類器的構造方法通常由統(tǒng)計方法、機器學習方法、神經(jīng)網(wǎng)絡方法等。這些方法能把數(shù)據(jù)庫中的數(shù)據(jù)映射到給定類別中某一個,以便用于預測,也就是利用歷史數(shù)據(jù)記錄,自動推導出給定數(shù)據(jù)的推廣描述,從而對未來數(shù)據(jù)進行預測。
2.聚類方法在電子商務中的應用。聚類是把一組個體按照相似性原則歸成若干類別。對電子商務來說,客戶聚類可以對市場細分理論提供有力的支持。市場細分的目的是使得屬于同一類別的個體之間的距離盡可能小,而不同類別的個體之間的距離盡可能大,通過對聚類的客戶特征的提取,電子商務網(wǎng)站可以為客戶提供個性化的服務。
3.數(shù)據(jù)抽取方法在電子商務中的應用。數(shù)據(jù)抽取的目的是對數(shù)據(jù)進行濃縮,給出它的緊湊描述,如求和值、平均值、方差值、等統(tǒng)計值、或者用直方圖、餅狀圖等圖形方式表示,更主要的是他從數(shù)據(jù)泛化的角度來討論數(shù)據(jù)總結。數(shù)據(jù)泛化是一種把最原始、最基本的信息數(shù)據(jù)從低層次抽象到高層次上的過程??刹捎枚嗑S數(shù)據(jù)分析方法和面向屬性的歸納方法。在電子商務活動中,采用維數(shù)據(jù)分析方法進行數(shù)據(jù)抽取,他針對的是電子商務活動中的客戶數(shù)據(jù)倉庫。在數(shù)據(jù)分析中經(jīng)常要用到諸如求和、總計、平均、最大、最小等匯集操作,這類操作的計算量特別大,可把匯集操作結果預先計算并存儲起來,以便用于決策支持系統(tǒng)使用。
4.關聯(lián)規(guī)則在電子商務中的應用。管理部門可以收集存儲大量的售貨數(shù)據(jù)和客戶資料,對這些歷史數(shù)據(jù)進行分析并發(fā)現(xiàn)關聯(lián)規(guī)則。如分析網(wǎng)上顧客的購買行為,幫助管理者規(guī)劃市場,確定商品的種類、價格、質量等。通常關聯(lián)規(guī)則有兩種:有意義的關聯(lián)規(guī)則和泛化關聯(lián)規(guī)則,有意義的關聯(lián)規(guī)則,即滿足最小支持度和最小可信度的規(guī)則。最小支持度,它表示一組對象在統(tǒng)計意義上的需滿足的最低程度,如電子商務活動中的客戶數(shù)量、客戶消費能力、消費方式等。后者即用戶規(guī)定的關聯(lián)規(guī)則的最低可靠度。第二是泛化規(guī)則,這種規(guī)則更實用,因為研究對象存在一種層次關系,如面包、蛋糕屬西點類,而西點又屬于食品類,有了層次關系后,可以幫助發(fā)現(xiàn)更多的有意義的規(guī)則。
三、結束語
電子商務是現(xiàn)代信息技術發(fā)展的必然結果,也是未來商業(yè)運作模式的必然選擇。利用數(shù)據(jù)挖掘技術,充分發(fā)揮企業(yè)的獨特優(yōu)勢,促進管理創(chuàng)新和技術創(chuàng)新,使企業(yè)在在電子商務的潮流中立于不敗之地。隨著數(shù)據(jù)挖掘算法的不斷發(fā)展和成熟,數(shù)據(jù)挖掘一定會有更加廣闊的應用前景。
參考文獻:
[1]曾貞:數(shù)據(jù)挖掘在電子商務中的應用甘肅農(nóng)業(yè),2004(7)
[2]馮艷王堅強:數(shù)據(jù)挖掘在電子商務上的應用,2002(3)
[3]呂延杰徐華飛:中國電子商務發(fā)展研究報告.北京郵電大學出版社