公務(wù)員期刊網(wǎng) 論文中心 正文

爬蟲技術(shù)的就業(yè)信息管理平臺設(shè)計

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了爬蟲技術(shù)的就業(yè)信息管理平臺設(shè)計范文,希望能給你帶來靈感和參考,敬請閱讀。

爬蟲技術(shù)的就業(yè)信息管理平臺設(shè)計

1平臺功能及架構(gòu)

1.1平臺功能

按照不同用戶和流程的需求,該平臺需要具備多種功能,具體包括基礎(chǔ)信息管理、撰寫簡歷的功能、基礎(chǔ)參數(shù)設(shè)置、招聘方管理、權(quán)限管理、互聯(lián)網(wǎng)招聘和求職等等。

1.2平臺功能架構(gòu)

校方、企業(yè)等有關(guān)方面的聯(lián)系是通過該信息平臺聯(lián)系起來的,因此,信息即時傳輸、共享以及分類是其應(yīng)具備的基本功能,以不同方面的實際需求作為切入點,對求職、推薦符合需求的人才等功能需求予以充分滿足,按照使用群體,可以更進一步的劃分該平臺。對招聘需求予以充分滿足,是該平臺企業(yè)子系統(tǒng)的主要作用,其涵蓋的功能有注冊、信息、在線招聘(審核人員是否滿足相關(guān)要求、在線筆試和面試)、反饋聘用結(jié)果等。對求職要求予以滿足是學(xué)生子系統(tǒng)的主要作用,相對于企業(yè)子系統(tǒng)其具有更加豐富的功能,具體有維護個人信息、撰寫和修改求職簡歷、登記求職信息等。求職意向是其中比較重要的功能,學(xué)生對于工作行業(yè)、職務(wù)、薪酬等方面的要求均通過該功能進行設(shè)置,除此之外,該功能還可以充分融合學(xué)生具有的工作和學(xué)習(xí)經(jīng)歷,并以此為基礎(chǔ)生成相應(yīng)的特征參數(shù);該子系統(tǒng)眾多功能中最關(guān)鍵的就是職位推薦,其在相應(yīng)特征參數(shù)的基礎(chǔ)上展開推薦算法,相似度計算的數(shù)據(jù)來自于招聘信息,在向特定學(xué)生推薦職位時是以位于該計算所得結(jié)果為依據(jù)的,如此,就業(yè)推薦等工作的精準(zhǔn)性可以得到可靠保證。對于就業(yè)招聘的各個相關(guān)方面而言,其聯(lián)系是通過學(xué)校實現(xiàn)的,基于此,審核企業(yè)等方面的資質(zhì)是該子系統(tǒng)必須具備的功能,同時可以提供合理的就業(yè)指導(dǎo)等,及時傳達和正確解釋國家有關(guān)部門下發(fā)的通知等,調(diào)查就業(yè)狀況、統(tǒng)計和分析就業(yè)局勢、管理相關(guān)信息的功能等。在上述眾多功能中最核心的就是數(shù)據(jù)管理,招聘職位的數(shù)據(jù)量會直接影響到就業(yè)成功率,招聘數(shù)據(jù)的來源主要包括兩方面,其一是注冊企業(yè);其二,則是智聯(lián)招聘等既有的比較具有代表性的人才招聘平臺,校方會定期從中對招聘信息進行挖掘,通過篩選和整理相關(guān)數(shù)據(jù)可以促使相應(yīng)的大數(shù)據(jù)得以形成。

2平臺的關(guān)鍵信息及技術(shù)

2.1學(xué)生求職意向特征模型的設(shè)計

本研究創(chuàng)建的平臺模型也是由多個不同維度構(gòu)成的,為了給預(yù)測和挖掘數(shù)據(jù)創(chuàng)造有利條件,本文對不同維度在取值上進行了嚴(yán)格的規(guī)范,不同維度的意義和對應(yīng)取值為:構(gòu)成特征模型的維度共計8項,具體涵蓋了受教育程度、經(jīng)驗等。不同維度的意義和取值是:受教育程度:該維度被劃分為7個不同等級,具體按照學(xué)歷由高到低排列,博士位居首位,而初中或無要求則位居第七。工作經(jīng)驗:n。n的值表示工作經(jīng)驗?zāi)晗?;對此沒有特殊要求的表示為0,反之,則規(guī)定具體的n值。期望單位性質(zhì):1事業(yè);2國企;3民營;4上市;5外資。期望工作地點:省/市;省;直轄市;直轄市/區(qū),如果只是寫上了省或直轄市,那么則可以直接等同于這一整個省的人群渴望從事這一項行業(yè):相關(guān)行業(yè)的各項操作也必須要予以規(guī)范化處理。期望崗位:根據(jù)國家相關(guān)職位的分類標(biāo)準(zhǔn)來進行詳細(xì)劃分,并做出妥善化處置。期望月薪:這里主要是用n來予以表示,[n-500,n+500,不管在什么時候,其的浮動空間都在500元左右,一切都是由系統(tǒng)直接進行設(shè)置。期望福利:這里主要囊括了“五險一金、周末雙休……”等在內(nèi)的多種表達類型。

2.2基于特征標(biāo)識的爬蟲技術(shù)的職位信息抓取

當(dāng)開始對于“行業(yè)”這一層次進行劃分,某服務(wù)平臺還是會將其直接劃分成為11個一級大類,而在另外一個平臺當(dāng)中則會與前者保持著一定的差異,其包含的是13個一級大類,甚至于在一些特殊情況之下,還會將招聘崗位的名稱、招聘人數(shù)等全部都包含其中。事實上,將上述要素刨除之外,我們還應(yīng)該要充分的了解到企業(yè)人力資源對求職者的反饋時間等,只有如此,企業(yè)的效率才會真正展現(xiàn)出來?;诖?,對于某一種服務(wù)平臺,我們除了需要對其平臺內(nèi)容進行了解外,還必須要充分的了解到職位信息頁面的相關(guān)源代碼,做出妥善化判斷。并通過Python語言來編寫出一系列完善的爬蟲程序,相關(guān)數(shù)據(jù)也會被清晰的記錄到位。

2.3基于大數(shù)據(jù)技術(shù)的數(shù)據(jù)職位信息的清洗與歸整

舉例而言,在“工作經(jīng)驗”方面主要有以下幾類措辭,具體如下:“5-7年經(jīng)驗、1年經(jīng)驗”等,具體的描寫還是由社會企業(yè)而定。在“招聘人數(shù)”方面主要有以下幾類措辭,具體如下:“招2人、招若干人”等;。所以,想要了解這一系列爬取的原生數(shù)據(jù),就必須要對其進行透徹化的分析與處理,每一項數(shù)據(jù)都需要被定時的清洗并全部都?xì)w整到一起,文本信息數(shù)值也會達到最大化狀態(tài)。這一平臺還是會基于數(shù)據(jù)來做出約定處理,相關(guān)“工作經(jīng)驗”也會直接被規(guī)整為“n或n-m”,“招聘人數(shù)”的數(shù)據(jù)也會被直接確定為整數(shù)。

2.4基于用戶需求特征的職位推薦算法

在進行職位推薦的時候,我們都應(yīng)該要充分的了解到每一位學(xué)生的個性求職需求,結(jié)合當(dāng)下的實際情況來將這一招聘崗位的特點全部都揭示出來,學(xué)生也能夠從中了解到適合自己的職位?,F(xiàn)如今,在運用推薦算法的時候,我們還是應(yīng)該要充分地將人口統(tǒng)計學(xué)的推薦、基于內(nèi)容的推薦等三種方式充分的利用起來,在具體的情況之下來做出最優(yōu)的選擇。之所以會選擇人口統(tǒng)計學(xué)的推薦方式,主要還是因為為了能夠充分的了解到學(xué)生的求職期望,只有如此,個體與其它學(xué)生的相似度也能夠全部都揭示出來,一些與學(xué)生相似度較高的職位也會被推薦出來,然而在這種情況之下,這一算法僅僅只是了解了當(dāng)下學(xué)生求職期望的相似度,但是卻沒有充分的考慮到學(xué)生與職位的匹配程度。關(guān)于內(nèi)容的推薦這一方式,其實與人口統(tǒng)計學(xué)的推薦存在極大的類似情況,究其核心,還是需要考慮到內(nèi)容數(shù)據(jù)的實際建模情況,在這種情況之下,學(xué)生在了解了一系列招聘職位的相似度之后,還會直接影響到算法的實際精度。基于當(dāng)前的這一協(xié)同過濾推薦算法,其發(fā)展核心還是需要根據(jù)用戶交互行為的實際化數(shù)據(jù)來推進建模工作的完成,更加具體而言,其主要囊括了用戶的推薦(User-basedRecommendationUF)、項目的推薦(Item-basedRecommendationOF)等三種方式,每一項都必須要予以切實的了解。事實上,基于用戶的推薦與基于人口統(tǒng)計學(xué)的推薦方式本身就存在極大的類似性,在一定程度之上,我們必須要清楚的了解到每一位學(xué)生對招聘職位歷史的偏好數(shù)據(jù),并將“k鄰近”算法予以充分的利用,這能夠很好的完成用戶的實際化相似度,學(xué)生們必須要充分的了解招聘職位的歷史偏好數(shù)據(jù),并對其做出準(zhǔn)確化的分析,運用“k鄰近”的這一種算法能夠很好的將招聘職位的相似度計算出來,并構(gòu)建起一個完善的推薦模型。

3爬蟲技術(shù)實現(xiàn)

在了解了當(dāng)前這一類典型人才招聘服務(wù)平臺所的招聘職位數(shù)據(jù)情況之后,我們必須要承認(rèn)一點,只有依靠爬蟲程序才能夠確保整個平臺的運行更加深入、持續(xù),在完成了一系列的初步清洗工作之后,其已經(jīng)獲得了87000條數(shù)據(jù)。在進行數(shù)據(jù)整理的時候,其還是應(yīng)該要針對于單位性質(zhì)、學(xué)歷等多個部分予以切實的調(diào)整,從而將其做出歸納與升級。

4結(jié)束語

本文主要是基于當(dāng)前就業(yè)管理工作目標(biāo)的實際情況,在充分的完成了一系列就業(yè)指導(dǎo)、管理等工作之后,我們能夠更好地滿足每一個學(xué)生的工作需求,針對于目前就業(yè)工作當(dāng)中所存在的招聘職位數(shù)量和質(zhì)量需求難的這一問題予以詳細(xì)化分析,并采取專業(yè)化的措施來將其解決?;趯W(xué)生自身的工作需求,在了解了人口統(tǒng)計學(xué)之后,采用合適的算法為學(xué)生推薦個性化工作,促進學(xué)生能夠順利就業(yè)。大量實踐的結(jié)果可以證明,這一系統(tǒng)能夠很好的讓學(xué)生實現(xiàn)就業(yè),找尋到自身心儀的工作,企業(yè)也能夠更好的選擇優(yōu)秀的人才,學(xué)校的就業(yè)工作質(zhì)量也明顯提升,因此,可以進一步推廣。

參考文獻

[1]林佳一.基于Web服務(wù)的高校就業(yè)信息服務(wù)平臺研究[J].計算機時代,2015(05).

[2]李暉,牛犇,李維皓.移動互聯(lián)網(wǎng)服務(wù)的隱私保護機制[J].中興通訊技術(shù),2015(03).

[3]李廣杰.高職院校導(dǎo)向型學(xué)籍管理網(wǎng)絡(luò)平臺的設(shè)計[J].信息與電腦(論版),2015(08).

[4]田建勇.基于云計算的Web數(shù)據(jù)挖掘研究[J].信息安全與術(shù),2015(04).

作者:曹素娥 單位:山西大同大學(xué)計算機與網(wǎng)絡(luò)工程學(xué)院