前言:本站為你精心整理了分析數(shù)據(jù)挖掘課程的教學(xué)思路和方法范文,希望能為你的創(chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
闡明了主成分分析在數(shù)據(jù)降維的同時能夠保持原始數(shù)據(jù)的絕大部分能量信息沒有損失,是一種最優(yōu)的數(shù)據(jù)描述和表示方法。通過對主成份分析理論基礎(chǔ)的講述,讓學(xué)生不僅掌握了主成分分析的內(nèi)容和作用,搞清楚了相關(guān)的計算過程,這也對學(xué)生更好地實現(xiàn)主成分分析的程序設(shè)計和應(yīng)用情況有了清楚的認識。對于教材中一些簡單的內(nèi)容,比如數(shù)據(jù)分箱、K近鄰分類等,我們要求學(xué)生自己理解,然后隨機抽取學(xué)生為其他同學(xué)講授,這樣可以提高學(xué)生的主動性,加深學(xué)生的理解。對于一些簡單的問題,如K-means聚類的類別中心為各類樣本的均值,我們可以讓學(xué)生自己證明,提高他們的理解力。在講授其他一些內(nèi)容時,比如說聚類分析,我們可以將聚類分析的各個過程用圖的形式表示出來,用空間中的點表示聚類樣本,這樣就大大增強了學(xué)生的理解。
我們在教學(xué)的過程中,也比較比較注重案例教學(xué)。例如,在講授神經(jīng)網(wǎng)絡(luò)時,我們可以用上海證券交易所中股市中股票隨時間變化的數(shù)據(jù)為例,讓學(xué)生討論如何應(yīng)用神經(jīng)網(wǎng)絡(luò)對股票價格進行預(yù)測。人工神經(jīng)網(wǎng)絡(luò)是一種模仿自然界動物神經(jīng)網(wǎng)絡(luò)行為特征,進行分布式并行信息處理的算法數(shù)學(xué)模型,能夠較好地處理具有一定復(fù)雜性的數(shù)據(jù),在預(yù)測、擬合等方面取得了很好的應(yīng)用效果。讓學(xué)生采用神經(jīng)網(wǎng)絡(luò)進行實際數(shù)據(jù)分析和處理,可以增強他們學(xué)習(xí)的積極性,更主動地投入到學(xué)習(xí)中去。我們也要求他們使用回歸分析的方法對股票價格進行預(yù)測,然后和神經(jīng)網(wǎng)絡(luò)預(yù)測的結(jié)果進行比較。通過這個過程,可以使學(xué)生們不但了解了神經(jīng)網(wǎng)絡(luò)與回歸分析算法的異同,加深他們對神經(jīng)網(wǎng)絡(luò)的認識。
加強實驗教學(xué),增強學(xué)生動手能力
信息與計算科學(xué)專業(yè)是以信息領(lǐng)域為背景,數(shù)學(xué)與信息、管理相結(jié)合的交叉學(xué)科專業(yè)。該專業(yè)培養(yǎng)的學(xué)生具有良好的數(shù)學(xué)基礎(chǔ),能熟練地使用計算機,初步具備在信息與計算科學(xué)領(lǐng)域的某個方向上從事科學(xué)研究,解決實際問題,設(shè)計開發(fā)有關(guān)軟件的能力。畢業(yè)生適合到企事業(yè)單位、高科技部門、高等院校、行政管理和經(jīng)濟管理部門,從事科研、教學(xué)和計算機應(yīng)用軟件的開發(fā)和管理工作,也可以繼續(xù)攻讀信息與計算科學(xué)及相關(guān)學(xué)科的碩士學(xué)位。從信息與計算科學(xué)專業(yè)的培養(yǎng)目標可以看出信息與計算科學(xué)專業(yè)的本科生不但需要掌握理論知識,還需要具有將所學(xué)知識用來解決實際問題的能力。數(shù)據(jù)挖掘作為一門應(yīng)用性較強的課程,需要學(xué)生能夠運用數(shù)據(jù)挖掘知識分析和解決實際問題,要求學(xué)生能夠熟練掌握數(shù)據(jù)挖掘的程序設(shè)計,以便在將來的就業(yè)中具有更好的適應(yīng)性,因此實驗環(huán)節(jié)的教學(xué)有著其必要性?;谶@些原因,我們在這門課中引入實驗環(huán)節(jié),并將其納入考核要求。我們實驗所用的基本軟件是SAS統(tǒng)計分析軟件。SAS軟件是一個集統(tǒng)計分析、報表圖形、信息系統(tǒng)開發(fā)和大型數(shù)據(jù)庫管理等多種強大功能為一體的大型軟件系統(tǒng),是目前國際上主流的統(tǒng)計分析軟件之一。我們信息專業(yè)在大三時開設(shè)這門課程,之前已經(jīng)學(xué)過C語言和JAVA等程序設(shè)計方法,有了一定的編程基礎(chǔ),因此學(xué)習(xí)使用SAS軟件并不是特別困難。而且,在SAS軟件中,系統(tǒng)自帶了許多數(shù)據(jù)挖掘函數(shù),這方便了同學(xué)們的使用。我們在平時的學(xué)習(xí)中,將一些SAS軟件的基本程序設(shè)計基礎(chǔ)知識先發(fā)給同學(xué)們,讓他們利用課后時間自己在個人電腦上進行熟悉,從而使得他們熟悉基本SAS程序設(shè)計方法,這樣可以在實驗課上直接運用SAS軟件進行數(shù)據(jù)挖掘程序的編寫。在實驗課上,我們主要將要實驗的內(nèi)容和相關(guān)數(shù)據(jù)資料提供給同學(xué),要求同學(xué)自己用數(shù)據(jù)挖掘的知識和SAS軟件進行編程實現(xiàn),并寫出實驗分析和小結(jié)。另外,在實驗中,我們也要求學(xué)生盡可能將一些實驗結(jié)果用圖表的形式如崖底碎石圖等表示出來,以利于進一步分析。對于少部分學(xué)有余力的同學(xué),我們也引導(dǎo)他們自編相關(guān)的程序。比如說在SAS軟件中進行K-均值聚類用fastclus這個函數(shù)就可以了,但是學(xué)生對程序具體實現(xiàn)過程可能不是很清楚。如果學(xué)生能夠?qū)⒊绦騅-均值聚類詳細程序步驟自己編寫出來,就可以表明學(xué)生對所K-均值聚類算法也有了較清楚的認識。另外,對于屬于數(shù)學(xué)建模協(xié)會的同學(xué),我們也引導(dǎo)他們將數(shù)據(jù)挖掘的知識和數(shù)學(xué)建模中某些問題相結(jié)合起來,對于以往出現(xiàn)的一些可以利用數(shù)據(jù)挖掘知識分析的問題讓他們利用相關(guān)的數(shù)據(jù)挖掘知識對其進行分析和求解,通過這樣的方式,可以這樣拓展這些同學(xué)的思路,也為數(shù)學(xué)建模培養(yǎng)了人才。
靈活的課后作業(yè)形式,提高學(xué)生的綜合能力
對于我們講授的課題,每學(xué)完一個算法,我們要求學(xué)生在網(wǎng)絡(luò)上搜索該方法的運用領(lǐng)域和技術(shù)要點,加深對該算法的理解。然后,我們讓每一個同學(xué)自己挑選一個該算法可以解決的問題,在網(wǎng)上搜集相關(guān)數(shù)據(jù),寫出實現(xiàn)程序,并寫出相應(yīng)的小論文。這也可以鍛煉學(xué)生的搜索、整理和分析處理數(shù)據(jù)的能力。對于課程中的某些案例,我們要求學(xué)生進行重新總結(jié)思考。比如在運用主成分分析進行入侵檢測的這個案例,案例中的主要指標是運用兩類樣本協(xié)方差特征根的差異進行分析和比較。我們讓學(xué)生思考該處理方法的優(yōu)缺點,同時讓學(xué)生思考有沒有其他的思路,比如按照模式分類的思想來實現(xiàn)。即首先主成份分析進行降維,然后運用K-近鄰分類方法進行分類。另外,也讓學(xué)生思考有沒有其他的思路,比如特征降維是否可以采用其他方法,如線性鑒別分析等;而分類方法是否可以采用BP神經(jīng)網(wǎng)絡(luò)等。進一步,我們可以讓學(xué)生比較主成份分析和線性鑒別分析有什么異同之處;K-近鄰分類和BP神經(jīng)網(wǎng)絡(luò)運用于分類時執(zhí)行過程有什么異同之處。讓學(xué)生對這些算法的理解更加透徹。另外,在課本的作業(yè)之外,我們也會自編一些題目,讓學(xué)生自己進行思考分析。比如,對于圖1雙圈圖,我們可以設(shè)置這樣的問題:將圖形的描點數(shù)據(jù)給大家,要求他們繪出圖形,說明形狀。然后要求他們運用K-means聚類聚為兩類,并且根據(jù)聚類的結(jié)果畫出圖形。然后將所得的圖形跟原始圖形進行比較,說明差異之處。通過這樣的問題,既可以使得學(xué)生對數(shù)據(jù)整理、畫圖等有一定的掌握,還使得他們熟悉了K-means聚類算法的編程過程。另外,使得他們不僅了解了K-means聚類算法的優(yōu)點,也使得他們理解K-means聚類算法作為一種線性方法的局限之處。四、小結(jié)綜上所述,“數(shù)據(jù)挖掘”課的教學(xué)既要注重基本理論與方法的講解,使得學(xué)生能夠掌握數(shù)據(jù)挖掘的基本理論和知識;又要培養(yǎng)學(xué)生的思考和分析能力,提高他們運用數(shù)據(jù)挖掘的相關(guān)程序解決實際問題的能力。從而使得所學(xué)的知識能夠真正運用于實踐中,提高學(xué)生的綜合能力。本文嘗試對本科數(shù)據(jù)挖掘教學(xué)做一些總結(jié),如何更好地提高《數(shù)據(jù)挖掘》這門課的教學(xué)質(zhì)量,期待更多的同行共同探討。
作者:徐春明單位:鹽城師范學(xué)院數(shù)學(xué)科學(xué)學(xué)院