999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

藥膳大數(shù)據(jù)的平臺(tái)構(gòu)建與實(shí)現(xiàn)

2021-04-01 05:43:48孫慧婷
關(guān)鍵詞:用戶

方 曉,孫慧婷

(1. 安徽省中醫(yī)藥科學(xué)院 亳州中醫(yī)藥研究所,安徽 亳州 236800;2. 亳州職業(yè)技術(shù)學(xué)院 信息工程系,安徽 亳州 236800)

1 藥膳大數(shù)據(jù)的分析

大數(shù)據(jù)是相對(duì)傳統(tǒng)數(shù)據(jù)而言的,在獲取數(shù)據(jù)、存儲(chǔ)數(shù)據(jù)、管理數(shù)據(jù)、分析與挖掘數(shù)據(jù)、應(yīng)用數(shù)據(jù)等方面規(guī)模上超過(guò)傳統(tǒng)數(shù)據(jù)。在思維方式上也形成大數(shù)據(jù)范式,主要包括:(1)技術(shù)方面,因大數(shù)據(jù)中數(shù)據(jù)量規(guī)模是海量的、 數(shù)據(jù)結(jié)構(gòu)和類(lèi)型是多模態(tài)的、數(shù)據(jù)的產(chǎn)生是實(shí)時(shí)性的,為此產(chǎn)生與之相適應(yīng)的采集數(shù)據(jù)、管理數(shù)據(jù)、分析數(shù)據(jù)。并行計(jì)算方面,從大數(shù)據(jù)產(chǎn)生角度分析,有面向批量數(shù)據(jù)計(jì)算模型、流式數(shù)據(jù)計(jì)算模型、圖式數(shù)據(jù)計(jì)算模型。(2)存儲(chǔ)方面,有HDFS、HBase、Tachyon 等分布式存儲(chǔ)開(kāi)源技術(shù)。(3)分析挖掘方面,傳統(tǒng)數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí),深度學(xué)習(xí)等新技術(shù)。(4)思維方面,在現(xiàn)實(shí)生產(chǎn)生活中,把大數(shù)據(jù)作為生產(chǎn)資料,云計(jì)算作為生產(chǎn)力,人工智能算法作為生產(chǎn)關(guān)系,將結(jié)果作為傳統(tǒng)企業(yè)的內(nèi)在生產(chǎn)動(dòng)力,發(fā)揮大數(shù)據(jù)價(jià)值[1]。

藥膳大數(shù)據(jù)涉及多領(lǐng)域多學(xué)科知識(shí),藥膳的生產(chǎn)過(guò)程主要包括:中藥材、烹飪、醫(yī)學(xué)三個(gè)方面。藥膳大數(shù)據(jù)是從藥膳生產(chǎn)、藥膳消費(fèi)活動(dòng)中產(chǎn)生的具有現(xiàn)實(shí)價(jià)值意義的數(shù)據(jù)集合。有學(xué)者從藥膳的生命周期的角度分析,認(rèn)為藥膳大數(shù)據(jù)包含從藥膳原材料生產(chǎn)、藥膳生產(chǎn)、藥膳消費(fèi)等環(huán)節(jié)采集的數(shù)據(jù);有學(xué)者從藥膳數(shù)據(jù)的組合元素上分析,藥膳大數(shù)據(jù)包括藥材數(shù)據(jù)、組合配方數(shù)據(jù)、生產(chǎn)配方數(shù)據(jù)、消費(fèi)群體等數(shù)據(jù)。本研究認(rèn)為藥膳大數(shù)據(jù)應(yīng)包括:(1)藥膳大數(shù)據(jù)指“大”的數(shù)據(jù)集合,有數(shù)據(jù)量大、結(jié)構(gòu)復(fù)雜、類(lèi)型多,又具有養(yǎng)生數(shù)據(jù)醫(yī)學(xué)、時(shí)空和序列的領(lǐng)域特點(diǎn)。(2)從功能上包括:藥膳大數(shù)據(jù)計(jì)算模型、藥膳大數(shù)據(jù)存儲(chǔ)技術(shù)和藥膳大數(shù)據(jù)分析挖掘技術(shù)。(3)藥膳大數(shù)據(jù)也指利用全量的、混雜的數(shù)據(jù)發(fā)現(xiàn)相關(guān)關(guān)系和規(guī)律,并以數(shù)據(jù)驅(qū)動(dòng)的方式來(lái)助推養(yǎng)生經(jīng)濟(jì)和養(yǎng)生思維。藥膳大數(shù)據(jù)生產(chǎn)應(yīng)用,其關(guān)鍵在于藥膳大數(shù)據(jù)平臺(tái)的構(gòu)建。

2 藥膳大數(shù)據(jù)平臺(tái)設(shè)計(jì)與構(gòu)建

2.1 需求分析

藥膳信息大數(shù)據(jù)平臺(tái)融合藥膳藥材、生產(chǎn)配方、消費(fèi)群體等數(shù)據(jù),并且海量存儲(chǔ)、深度挖掘這些數(shù)據(jù),為藥膳消費(fèi)、藥膳養(yǎng)生文化的推廣提供支撐,該平臺(tái)應(yīng)具備下列功能性需求:

(1)藥膳數(shù)據(jù)采集方面,藥膳數(shù)據(jù)采集接口分為線上和線下。線上主要對(duì)第三方餐飲信息平臺(tái)數(shù)據(jù)采集,具有實(shí)時(shí)性,線下對(duì)批量數(shù)據(jù)進(jìn)行導(dǎo)入。采集接口支持結(jié)構(gòu)化數(shù)據(jù)記錄和非結(jié)構(gòu)化數(shù)據(jù)記錄。

(2)存儲(chǔ)數(shù)據(jù)方面,支持多系統(tǒng)存儲(chǔ)方式,以MapReduce模型為基礎(chǔ),對(duì)藥膳數(shù)據(jù)的相關(guān)性進(jìn)行存儲(chǔ)優(yōu)化,對(duì)藥膳數(shù)據(jù)使用頻率進(jìn)行存儲(chǔ)優(yōu)化,均衡各數(shù)據(jù)節(jié)點(diǎn)計(jì)算復(fù)雜度。并提供高效的管理與快速查詢功能。

(3)數(shù)據(jù)計(jì)算方面,面向海量藥膳的數(shù)據(jù),通過(guò)MapReduce并行計(jì)算引擎,對(duì)流處理大數(shù)據(jù),大圖數(shù)據(jù)以及內(nèi)存的計(jì)算,可實(shí)現(xiàn)自定義配置。

(4)分析挖掘方面,應(yīng)提供面向藥膳領(lǐng)域的分析,利用統(tǒng)計(jì)學(xué)方法,對(duì)藥膳數(shù)據(jù)進(jìn)行計(jì)算與分析。通過(guò)深度學(xué)習(xí)算法建立學(xué)習(xí)模型,實(shí)現(xiàn)個(gè)性化數(shù)據(jù)的推送,面對(duì)數(shù)據(jù)應(yīng)用層面,靈活配置算法,可視化挖掘結(jié)果。

2.2 平臺(tái)架構(gòu)設(shè)計(jì)

藥膳大數(shù)據(jù)平臺(tái)融合藥膳數(shù)據(jù)采集、存儲(chǔ)、計(jì)算與分析挖掘的整個(gè)生命周期。綜合相關(guān)文獻(xiàn)分析,研究其他平臺(tái)的架構(gòu)。對(duì)藥膳大數(shù)據(jù)平臺(tái)的架構(gòu)進(jìn)行了設(shè)計(jì),如圖1所示。

圖1 藥膳信息大數(shù)據(jù)平臺(tái)的架構(gòu)

(1)數(shù)據(jù)源

藥膳大數(shù)據(jù)可分以下5種,如圖2所示。

圖2 藥膳大數(shù)據(jù)平臺(tái)數(shù)據(jù)資源體系

①膳材類(lèi)數(shù)據(jù),包括食材數(shù)據(jù)、膳材數(shù)據(jù)、功效數(shù)據(jù)、制作和加工流程數(shù)據(jù)等,這些數(shù)據(jù)大多以文本存儲(chǔ)在系統(tǒng)中。

②藥膳生產(chǎn)類(lèi)數(shù)據(jù):包括食療配方數(shù)據(jù)、藥膳配方數(shù)據(jù),制作的流程等數(shù)據(jù),這些數(shù)據(jù)以文本、音頻、視頻非結(jié)構(gòu)化的方式存儲(chǔ)。

③銷(xiāo)售管理類(lèi)數(shù)據(jù):包括藥膳消費(fèi)數(shù)據(jù)、消費(fèi)店面數(shù)據(jù)、消費(fèi)時(shí)空域數(shù)據(jù)等,這些數(shù)據(jù)多以結(jié)構(gòu)化的形式存儲(chǔ)在關(guān)系型數(shù)據(jù)庫(kù)中。

④藥膳消費(fèi)者行為數(shù)據(jù),即消費(fèi)者的行為數(shù)據(jù)、基本信息數(shù)據(jù)、健康數(shù)據(jù)等。

⑤評(píng)價(jià)類(lèi)數(shù)據(jù),包括門(mén)店服務(wù)數(shù)據(jù)、消費(fèi)感知數(shù)據(jù)、藥膳評(píng)價(jià)數(shù)據(jù),是以文本為主的數(shù)據(jù)。

(2)采集層

藥膳數(shù)據(jù)的采集可以采用線上實(shí)時(shí)和線下批量?jī)煞N方式進(jìn)行。實(shí)時(shí)采集主要利用接口對(duì)第三方平臺(tái)進(jìn)行實(shí)時(shí)采集、爬蟲(chóng)技術(shù)采集網(wǎng)絡(luò)隱藏的藥膳相關(guān)數(shù)據(jù)。批量采集通過(guò)用戶的導(dǎo)入、復(fù)制、錄入等行為對(duì)系統(tǒng)操作的日志、其他后臺(tái)記錄、相關(guān)資源文件等數(shù)據(jù)進(jìn)行采集;而對(duì)于線下傳統(tǒng)消費(fèi)環(huán)境中的數(shù)據(jù)可以利用藥膳協(xié)會(huì)資源實(shí)現(xiàn)平臺(tái)接口對(duì)接采集技術(shù)進(jìn)行獲取。

(3)存儲(chǔ)層

不同的數(shù)據(jù)源采集的數(shù)據(jù)在結(jié)構(gòu)、類(lèi)別、規(guī)模上是不相同的。因此,在數(shù)據(jù)存儲(chǔ)上采用不同的數(shù)據(jù)存儲(chǔ)系統(tǒng)。對(duì)文本數(shù)據(jù)采用文件存儲(chǔ)系統(tǒng)、結(jié)構(gòu)化數(shù)據(jù)采用相關(guān)的數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行存儲(chǔ)。對(duì)于零散、結(jié)構(gòu)復(fù)雜的可以通過(guò)內(nèi)存進(jìn)行存儲(chǔ)。為存儲(chǔ)龐大的藥膳數(shù)據(jù),存儲(chǔ)系統(tǒng)采用分布式架構(gòu)。為后續(xù)的數(shù)據(jù)處理、數(shù)據(jù)挖掘提供支持。

(4)數(shù)據(jù)處理層

大數(shù)據(jù)管理平臺(tái)的核心在于分析和挖掘價(jià)值高的相關(guān)關(guān)系,而實(shí)現(xiàn)這一目的的關(guān)鍵在于數(shù)據(jù)處理層的計(jì)算模型。本平臺(tái)運(yùn)用MapReduce計(jì)算架構(gòu),對(duì)于不同數(shù)據(jù)類(lèi)別有相對(duì)應(yīng)計(jì)算模型,對(duì)大規(guī)模歷史數(shù)據(jù)采用批處理計(jì)算模型進(jìn)行并行運(yùn)算;對(duì)實(shí)時(shí)產(chǎn)生的流式數(shù)據(jù)采用流計(jì)算模型進(jìn)行處理;對(duì)平臺(tái)的計(jì)算結(jié)果以知識(shí)圖譜形式可視化。對(duì)知識(shí)圖譜的管理采用圖計(jì)算模型。為提高平臺(tái)響應(yīng)實(shí)時(shí)性、提高數(shù)據(jù)計(jì)算的速度,利用內(nèi)存計(jì)算模型進(jìn)行內(nèi)存管理。

(5)分析挖掘?qū)?/p>

藥膳大數(shù)據(jù)應(yīng)用主要方面:①藥膳經(jīng)營(yíng)統(tǒng)計(jì),通過(guò)藥膳消費(fèi)和生產(chǎn)產(chǎn)生的數(shù)據(jù),運(yùn)用數(shù)據(jù)統(tǒng)計(jì)分析方法對(duì)藥膳類(lèi)別銷(xiāo)售排名、藥膳門(mén)店銷(xiāo)售排名、用戶消費(fèi)排名、食材和藥材消費(fèi)排名,以及用戶健康狀況與藥膳藥用功能相關(guān)關(guān)系統(tǒng)計(jì);②藥膳消費(fèi)行為分析,通過(guò)第三方餐飲平臺(tái)的藥膳消費(fèi)數(shù)據(jù)、實(shí)體店獨(dú)立點(diǎn)餐平臺(tái)的數(shù)據(jù)庫(kù)記錄數(shù)據(jù)、在藥膳網(wǎng)站網(wǎng)絡(luò)爬取的日志數(shù)據(jù),運(yùn)用機(jī)器學(xué)習(xí)的深度學(xué)習(xí)算法,以及傳統(tǒng)的挖掘算法如規(guī)則挖掘、聚類(lèi)分析等算法進(jìn)行挖掘分析,建立用戶畫(huà)像,主要包括口感、偏好、習(xí)慣、需求等方面,為藥膳的營(yíng)銷(xiāo)、藥膳文化傳播與文化繼承進(jìn)行個(gè)性化推送奠定算法計(jì)算基礎(chǔ)。

(6)應(yīng)用層

大數(shù)據(jù)的價(jià)值在于應(yīng)用。基于藥膳經(jīng)營(yíng)數(shù)據(jù)統(tǒng)計(jì)分析可以對(duì)藥膳產(chǎn)品進(jìn)行數(shù)字畫(huà)像,包括消費(fèi)用戶健康類(lèi)別、體驗(yàn)度、評(píng)價(jià)情況、產(chǎn)品生產(chǎn)門(mén)店,發(fā)現(xiàn)藥膳產(chǎn)品的消費(fèi)群體、預(yù)測(cè)未來(lái)藥膳市場(chǎng)需求;然后進(jìn)行個(gè)性化推薦,并對(duì)藥膳的生產(chǎn)藥材、食材進(jìn)消存情況進(jìn)行干預(yù)管理。在藥膳消費(fèi)者方面,可對(duì)消費(fèi)者行為進(jìn)行指導(dǎo),以便消費(fèi)者調(diào)整消費(fèi)行為、養(yǎng)生計(jì)劃等。對(duì)藥膳生產(chǎn)資源的挖掘,構(gòu)建藥材、藥膳、養(yǎng)生的知識(shí)圖譜。

3 藥膳信息大數(shù)據(jù)平臺(tái)的關(guān)鍵實(shí)現(xiàn)技術(shù)

3.1 藥膳大數(shù)據(jù)EXL技術(shù)

因大數(shù)據(jù)平臺(tái)數(shù)據(jù)的多樣性特征,在數(shù)據(jù)采集模塊上,針對(duì)類(lèi)型不同的數(shù)據(jù)采取與之對(duì)應(yīng)的采集技術(shù)。對(duì)半結(jié)構(gòu)數(shù)據(jù),采用xmL、Flume、Kafka等組件技術(shù),但上述技術(shù)框架需要對(duì)數(shù)據(jù)的抽取、轉(zhuǎn)換、加載。而EXL技術(shù)是實(shí)現(xiàn)這些處理的最佳選擇。

對(duì)于藥膳大數(shù)據(jù)平臺(tái)而言,數(shù)據(jù)量大,傳統(tǒng)的方案清洗數(shù)據(jù)導(dǎo)致性能下降,為應(yīng)對(duì)此問(wèn)題, 本系統(tǒng)利用 Hadoop 平臺(tái)中的 Hive工具清洗數(shù)據(jù)。Hive工具的優(yōu)點(diǎn)是對(duì)大量結(jié)構(gòu)化數(shù)據(jù)進(jìn)行存儲(chǔ)和處理, 數(shù)據(jù)處理模塊如圖3所示。

圖3 藥膳信息大數(shù)據(jù)平臺(tái)的數(shù)據(jù)處理模塊

數(shù)據(jù)源主要包括數(shù)據(jù)庫(kù) 、數(shù)據(jù)倉(cāng)庫(kù) 、數(shù)據(jù)表和其他類(lèi)型的數(shù)據(jù)集合。數(shù)據(jù)源服務(wù)器通過(guò)用戶的請(qǐng)求對(duì)數(shù)據(jù)源提取相關(guān)的數(shù)據(jù)。按照預(yù)定義的數(shù)據(jù)結(jié)構(gòu)進(jìn)行抽取、通過(guò)數(shù)據(jù)清洗引擎并對(duì)數(shù)據(jù)進(jìn)行分析、識(shí)別噪音、合成。用戶可以定義知識(shí)庫(kù)編輯和定義數(shù)據(jù)清洗規(guī)則。

3.2 藥膳大數(shù)據(jù)存儲(chǔ)設(shè)計(jì)技術(shù)

藥膳數(shù)據(jù)的集中存儲(chǔ)平臺(tái)的關(guān)鍵性問(wèn)題隨著數(shù)據(jù)結(jié)構(gòu)的復(fù)雜化,數(shù)據(jù)存儲(chǔ)由關(guān)系型數(shù)據(jù)庫(kù)轉(zhuǎn)到可擴(kuò)展的 NoSQL 型分布式數(shù)據(jù)庫(kù)。構(gòu)建在 HDFS 之上的分布式數(shù)據(jù)庫(kù)HBase具有可伸縮性動(dòng)態(tài)模式特點(diǎn),對(duì)于實(shí)時(shí)讀寫(xiě)大規(guī)模的數(shù)據(jù)是最優(yōu)選擇[2]。

3.2.1 數(shù)據(jù)庫(kù)部署設(shè)計(jì)

本平臺(tái)數(shù)據(jù)存儲(chǔ)設(shè)計(jì)由ZooKeeper 獨(dú)立部署到兩臺(tái)機(jī)器上,負(fù)責(zé)協(xié)調(diào) RegionServer服務(wù)器集群和Hmaster服務(wù)器集群、meta 表信息的存儲(chǔ)和感知 RegionServer 的狀態(tài),這樣部署有以下優(yōu)點(diǎn):第一,HBase 和 ZooKeeper 的強(qiáng)耦合,方便后期對(duì) HBase 集群的升級(jí)、管理以及大數(shù)據(jù)平臺(tái)的擴(kuò)展。第二,ZooKeeper 作為配置中心,一旦配置信息發(fā)生改變或突發(fā)崩潰,能提供自動(dòng)容錯(cuò)的時(shí)間,重新選取候選者執(zhí)行未處理完的作業(yè)。第三,ZooKeeper通過(guò)上層的索引支持,實(shí)現(xiàn)自動(dòng)負(fù)載均衡。

3.2.2 藥膳數(shù)據(jù) rowkey 的設(shè)計(jì)

為了避免“熱點(diǎn)”問(wèn)題。我們將HBase 與 Solr 相結(jié)合進(jìn)行解決。HBase 解決方法將風(fēng)格口味數(shù)據(jù)進(jìn)行隨機(jī)散列,并提前為藥膳產(chǎn)品信息數(shù)據(jù)表建立預(yù)分區(qū),隨機(jī)散列化風(fēng)格口味數(shù)據(jù)采用MD5 算法[3]。風(fēng)格口味數(shù)據(jù)由風(fēng)格口味FID和類(lèi)別CID兩部分組成, 數(shù)據(jù)缺失情況下有正常ID進(jìn)行補(bǔ)充。由于藥膳產(chǎn)品查詢模塊會(huì)根據(jù)藥膳類(lèi)別號(hào)直接索引,因此行鍵末位風(fēng)格口味FID,將藥膳產(chǎn)品類(lèi)別CID數(shù)據(jù)轉(zhuǎn)換為哈希值再轉(zhuǎn)換為Bytes 類(lèi)型,加上風(fēng)格口味FID轉(zhuǎn)為 Bytes 類(lèi)型的值,即組成行鍵。最后生成 rowkey 的函數(shù)如(1) 所示:

rowkey = MD5Hash. getMD5AsHex(CID) +CID + FID,

(1)

3.2.3 藥膳產(chǎn)品數(shù)據(jù)列簇的設(shè)計(jì)

藥膳產(chǎn)品數(shù)據(jù)主要字段包括: 生產(chǎn)門(mén)店、產(chǎn)品類(lèi)別號(hào)、產(chǎn)品號(hào)、風(fēng)格口味類(lèi)別、生產(chǎn)時(shí)間、消費(fèi)時(shí)間、制作主廚ID、食材1、食材2、藥材1、藥材2等最少20個(gè)字段,至多42字段。生產(chǎn)時(shí)間與消費(fèi)時(shí)間采用 4 位時(shí)間占位符進(jìn)行存儲(chǔ),精確到分鐘級(jí)別。其他字段統(tǒng)一解析成字符串類(lèi)型存儲(chǔ)。因?yàn)榱写匾?guī)模與 region 刷新I/O開(kāi)銷(xiāo)是成正比的,且藥膳產(chǎn)品數(shù)據(jù)各字段應(yīng)用較統(tǒng)一,所有字段共同構(gòu)成藥膳產(chǎn)品數(shù)據(jù)唯一列簇 FProperties。藥膳產(chǎn)品數(shù)據(jù)列簇設(shè)計(jì)如表 1 所示。

表1 藥膳產(chǎn)品信息數(shù)據(jù)表結(jié)構(gòu)

3.2.4 文本藥膳數(shù)據(jù)存儲(chǔ)技術(shù)

藥膳大數(shù)據(jù)平臺(tái)的思路是將若干個(gè)小規(guī)模文本文件組合成大規(guī)模文本文件,減少小規(guī)模文件的數(shù)量,從而減小內(nèi)存占用率提高文件的讀取速度。運(yùn)用HAR、Sequence File 和 Map File技術(shù)方法把藥膳配方數(shù)據(jù)文件、藥膳功效數(shù)據(jù)文件、藥膳藥材功效數(shù)據(jù)文件合并成規(guī)模大的文件,在完成對(duì)小規(guī)模數(shù)據(jù)文件的冗余壓縮后,將處理后的文件存儲(chǔ)在HDFS中,同時(shí)進(jìn)一步降低Name Node節(jié)點(diǎn)的數(shù)據(jù)規(guī)模,降低Name Node的內(nèi)存使用率。

3.3 藥膳大數(shù)據(jù)的分析挖掘技術(shù)

藥膳大數(shù)據(jù)的核心是綜合運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)藥膳數(shù)據(jù)進(jìn)行預(yù)處理、精準(zhǔn)分析,通過(guò)分析與挖掘手段,把數(shù)據(jù)變成有價(jià)值的信息,以此促進(jìn)藥膳生產(chǎn)管理的優(yōu)化、藥膳文化傳承與推廣、促進(jìn)藥膳消費(fèi)。本平臺(tái)對(duì)目前可用的藥膳大數(shù)據(jù)分析和挖掘,所用到的算法與應(yīng)用總結(jié)如表 2 所示。

表2 藥膳大數(shù)據(jù)平臺(tái)的相關(guān)數(shù)據(jù)分析技術(shù)一覽表

對(duì)藥膳大數(shù)據(jù)分析挖掘有兩個(gè)方面的研究工作:(1)對(duì)挖掘算法的研究;通過(guò)海量、高速、多樣藥膳大數(shù)據(jù)處理需求,解決藥膳養(yǎng)生信息化問(wèn)題;(2)充分挖掘藥膳數(shù)據(jù)的領(lǐng)域特征,以深度學(xué)習(xí)算法結(jié)合消費(fèi)認(rèn)知、消費(fèi)習(xí)慣構(gòu)建精準(zhǔn)度高、適應(yīng)性強(qiáng)的個(gè)性化推送系統(tǒng)。

4 平臺(tái)的實(shí)現(xiàn)

藥膳大數(shù)據(jù)平臺(tái)開(kāi)發(fā)運(yùn)用當(dāng)前Java的主流技術(shù),Hadoop技術(shù)是該平臺(tái)核心技術(shù),主要以半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)為主存儲(chǔ)大量數(shù)據(jù),批量處理海量數(shù)據(jù),建立數(shù)據(jù)處理系統(tǒng)。平臺(tái)支持Windows和Linux(CentOS Linux 6.3 x86_64版本)操作系統(tǒng)。

該平臺(tái)分為藥膳配方數(shù)據(jù)分析、消費(fèi)用戶社交網(wǎng)絡(luò)分析、藥膳數(shù)據(jù)挖掘、用戶畫(huà)像、個(gè)性化推送五個(gè)模塊。藥膳配方數(shù)據(jù)分析包括食材配方數(shù)據(jù)、功效數(shù)據(jù)、制作和加工流程數(shù)據(jù)等,這類(lèi)數(shù)據(jù)多以文本、音視頻等非結(jié)構(gòu)化的形式存儲(chǔ)在文件系統(tǒng)中,主要采用Text Categorization、Concept Extraction等算法,結(jié)果如圖4所示。

圖4 藥膳配方數(shù)據(jù)分析

藥膳消費(fèi)后,帶來(lái)用戶健康指數(shù)的變化,用戶對(duì)藥膳的效用產(chǎn)生評(píng)價(jià)。效用評(píng)價(jià)數(shù)據(jù)與藥膳配方以及生產(chǎn)流程數(shù)據(jù)、食材數(shù)據(jù),四者間關(guān)聯(lián)關(guān)系挖掘和分析如圖5所示。消費(fèi)用戶社交網(wǎng)絡(luò)分析,該模塊主要采用Community Discovery、Page Rank等算法計(jì)算消費(fèi)用戶社群關(guān)系,對(duì)消費(fèi)用戶社群網(wǎng)絡(luò)中關(guān)系進(jìn)行分析。

圖5 消費(fèi)用戶社交網(wǎng)絡(luò)分析

數(shù)據(jù)挖掘模塊即從數(shù)據(jù)庫(kù)中大量的數(shù)據(jù)揭示出隱含的、潛在的信息的過(guò)程。通過(guò)自動(dòng)化地分析數(shù)據(jù),作出相關(guān)的歸納性的推理,并進(jìn)行可視化展現(xiàn),如圖6所示,如通過(guò)Association Rule Minin算法分析藥膳功效與疾病關(guān)聯(lián)挖掘、藥膳功效與養(yǎng)生部位關(guān)聯(lián)挖掘、構(gòu)建藥膳、疾病、部位關(guān)系圖。

圖6 藥膳數(shù)據(jù)挖掘

利用聚類(lèi)、分類(lèi)等相關(guān)數(shù)據(jù)挖掘方法分析每種藥膳消費(fèi)用戶群特征,以主成分分析方法挖掘消費(fèi)用戶群的主從屬性特征(年齡、職業(yè)、收入等)。再以關(guān)聯(lián)規(guī)則挖掘消費(fèi)用戶群與藥膳種類(lèi)、效用、價(jià)格之間的關(guān)系,最后構(gòu)建每個(gè)品種藥膳的用戶畫(huà)像并可視化,如圖7所示。該模塊包含內(nèi)容有:(1)消費(fèi)用戶分類(lèi),根據(jù)用戶畫(huà)像推薦藥膳產(chǎn)品;(2)根據(jù)用戶消費(fèi)記錄和信息閱讀記錄,利用樸素貝葉斯判斷用戶的消費(fèi)習(xí)慣;(3)采用人工神經(jīng)網(wǎng)絡(luò)算法,為高緯度特征數(shù)據(jù)相關(guān)學(xué)習(xí)。

圖7 藥膳數(shù)據(jù)挖掘

5 結(jié)語(yǔ)

構(gòu)建藥膳大數(shù)據(jù)平臺(tái)是消費(fèi)者個(gè)性化推送、藥膳門(mén)店精準(zhǔn)化管理的要求,是量化藥膳生產(chǎn)企業(yè)管理、深入研究藥膳文化傳承與推廣的需求。藥膳產(chǎn)業(yè)的發(fā)展應(yīng)以藥膳大數(shù)據(jù)平臺(tái)為依托,以破解當(dāng)前旅游養(yǎng)生產(chǎn)業(yè)信息化孤島問(wèn)題,通過(guò)海量藥膳數(shù)據(jù)的采集、存儲(chǔ)與計(jì)算、分析挖掘,驅(qū)動(dòng)藥膳在個(gè)性化消費(fèi)、精準(zhǔn)生產(chǎn)、科學(xué)管理、藥膳研究、養(yǎng)生文化等多方面的變革與創(chuàng)新,促進(jìn)大數(shù)據(jù)與養(yǎng)生旅游的深度融合。本研究按照軟件工程的思路,從解決藥膳養(yǎng)生信息化問(wèn)題出發(fā)設(shè)計(jì)并構(gòu)建了藥膳大數(shù)據(jù)平臺(tái),并對(duì)涉及的關(guān)鍵實(shí)現(xiàn)技術(shù)進(jìn)行了詳細(xì)闡述。后續(xù)研究將基于該平臺(tái)完善個(gè)性化推送模式、精準(zhǔn)生產(chǎn)與管理模式的實(shí)踐應(yīng)用,以期為藥膳生產(chǎn)者、消費(fèi)者、文化傳承者提供更精準(zhǔn)性的個(gè)性化支持。

猜你喜歡
用戶
雅閣國(guó)內(nèi)用戶交付突破300萬(wàn)輛
您撥打的用戶已戀愛(ài),請(qǐng)稍后再哭
關(guān)注用戶
關(guān)注用戶
兩新黨建新媒體用戶與全網(wǎng)新媒體用戶之間有何差別
關(guān)注用戶
關(guān)注用戶
挖掘用戶需求尖端科技應(yīng)用
Camera360:拍出5億用戶
100萬(wàn)用戶
主站蜘蛛池模板: 精品福利国产| 国产网友愉拍精品| 国产无码高清视频不卡| 国产av一码二码三码无码| 亚洲日韩高清无码| 日韩色图区| 精品午夜国产福利观看| 日本伊人色综合网| 精品视频一区二区三区在线播| 国产高清不卡视频| 国产精品天干天干在线观看| 成人无码一区二区三区视频在线观看| 亚洲视频免费播放| 国产永久无码观看在线| 国产网友愉拍精品视频| 色网在线视频| 国产农村妇女精品一二区| 国产日韩丝袜一二三区| 国产女人在线视频| 成人另类稀缺在线观看| 国产特一级毛片| 成人国产精品视频频| 四虎精品国产AV二区| 婷婷99视频精品全部在线观看| 亚洲人成网7777777国产| 亚洲中文字幕国产av| 尤物午夜福利视频| 激情六月丁香婷婷| 欧美人人干| 欧美日韩亚洲综合在线观看| 怡春院欧美一区二区三区免费| 尤物视频一区| 国产精品视频免费网站| 亚洲精品人成网线在线| 亚洲高清中文字幕| 国内精自视频品线一二区| 久久久成年黄色视频| 亚洲国内精品自在自线官| 日韩欧美中文亚洲高清在线| 国产99欧美精品久久精品久久| 蜜芽一区二区国产精品| 原味小视频在线www国产| 久久久久国产精品免费免费不卡| 在线精品欧美日韩| 国产丝袜一区二区三区视频免下载| 日韩精品毛片| 日本午夜在线视频| 日本免费福利视频| 国产理论精品| 中文纯内无码H| 99无码中文字幕视频| 亚洲国产日韩在线观看| yjizz国产在线视频网| 成人福利在线视频免费观看| 高清大学生毛片一级| 亚洲嫩模喷白浆| 亚洲视频影院| 日韩最新中文字幕| 久久精品丝袜| 久久久久久久久亚洲精品| 四虎永久在线| 国产黄色视频综合| 在线观看网站国产| 三上悠亚精品二区在线观看| 波多野结衣一二三| 日韩午夜福利在线观看| 91av成人日本不卡三区| 美女扒开下面流白浆在线试听| 亚洲国产中文欧美在线人成大黄瓜| 国产亚洲精品自在久久不卡| 国产乱子伦视频在线播放| 一区二区三区四区日韩| 狠狠亚洲婷婷综合色香| 最新亚洲人成无码网站欣赏网| 黄色福利在线| 亚洲大尺码专区影院| 四虎精品黑人视频| 亚洲成A人V欧美综合天堂| 亚洲高清资源| 国产靠逼视频| 欧美午夜久久| 亚洲精品无码抽插日韩|