蔣佩宏 楊杉



摘要:以參與線上調查問卷的用戶為研究對象,對參與調查的用戶對于自身情況填寫的問卷答案進行用戶看重手機性能指標的研究。采用SPSSModeler、PyCharm、Excel,對用戶看重手機的不同性能指標進行分析。分析結果可以看出不同的用戶對內存大小、運行速度、電池續航、外觀、屏幕大小、像素的要求,從而有效的針對各要求進行品牌產品的改進。
關鍵詞:性能指標;內存大小;運行速度;像素
1 引言
隨著手機行業的發展,各式各樣的手機在市場上層出不窮。智能手機區別于功能單一的傳統手機,是整合了通信、攝影、娛樂等多種功能的移動數據智能終端,在互聯網時代已成為人們在生活中必不可少的工具。[1]這使用戶對于手機的各性能指標的要求越來越高,對于手機用戶而言,選購時不僅要關注CPU有多強大、屏幕有多高清,更要考慮內存夠不夠快、數據傳輸夠不夠流暢?[2]外觀對于手機來說是非常重要的一個方面,一個具有美感的手機產品,相較于其他產品更容易吸引人們的關注[3]人們對手機鏡頭像素要求也不斷提高[4]。由于不同年齡段或者使用不同手機品牌的用戶看重的性能指標不一樣,所以對其進行分析,并給予建議,從而使各手機品牌對其產品的性能指標進行改進,使品牌的產品銷售量更高。
2 研究思路
以參與線上調查問卷的用戶為研究對象,對參與調查的用戶對于自身情況填寫的問卷答案進行用戶看重手機性能指標的研究。采用SPSSModeler、PyCharm、Excel,對用戶看重手機的不同性能指標進行分析。
3 數據說明
3.1 數據來源
采用問卷星進行線上調查問卷的方式進行數據的收集,參與調查的用戶達748人,數據表中包含了用戶的年齡段、用戶現在使用的手機品牌、用戶手機的價格區間、用戶最看重手機的性能指標、用戶對現在所使用的手機有何不滿、如果更換手機會選擇什么品牌的手機、用戶希望即將發布的手機具有哪些突出的功能、用戶認為國產手機最應該提升的方面。
3.2 數據清洗
手機的數據表中,有一些無效數據,比如:沒有填寫某些選項,這樣會造成數據的缺失,所以將數據進行預處理,篩選出對于數據分析有效的數據,把無效數據進行刪除,數據表剩余數據為690條。
4 數據分析
4.1 規則集分析
4.1.1 數據建模
1)導入數據的Excel表格,進行過濾操作,此次過濾是因為導入的數據字段有多選題,字段的表述不夠清晰,所以將字段名稱進行修改,使其能夠準確表達字段的意思。
2)進行類型的設置,是為了將選項的測量值轉換成名義類型,并且在格式設置中將值用整數表達。
3)再次進行類型設置,將需要進行決策樹分析的字段的角色設置為‘目標,將數據中的基本信息設置為‘輸入,將其他信息設置為‘無。
4)建模,將“用戶最看重手機的性能指標是什么”該題的選項進行規則集分析,C5.0是經典的決策樹模型算法之一,可生成多分支的決策樹,目標變量為分類變量,使用C5.0算法可以生成決策樹或者規則集。C5.0模型根據能帶來的最大信息增益的字段拆分樣本。第一次拆分確定的樣本子集隨后再次拆分,通常是根據另一個字段進行拆分,這一過程重復進行指導樣本子集不能再被拆分為止。最后,重新緝拿眼最低層次的拆分,哪些對模型值沒有顯著貢獻的樣本子集被提出或者修剪。
4.1.2 結果分析
1)題:“您最看重手機的什么性能指標?”,A(內存大小)選項的規則分析(對正確率大于60%的規則進行分析):
以下4條規則為您最看重手機的什么性能指標?選擇A(內存大小)選項的規則,正確率為65.34%,下面對每一條規則做出具體分析:
規則1用于1.0:
年齡段在46-60的人;并且手機價格為8000以上,具有以上特征的人,更傾向于在看重手機的什么性能指標問題上會選擇內存大小。
規則2用于1.0:
年齡段在15-22的人,具有以上特征的人,更傾向于在看重手機的什么性能指標問題上會選擇內存大小。
規則3用于1.0:
手機價格為2000-4000,具有以上特征的人,更傾向于在看重手機的什么性能指標問題上會選擇內存大小。
規則4用于1.0:
手機品牌為華為,具有以上特征的人,更傾向于在看重手機的什么性能指標問題上會選擇內存大小。
小結:在看重手機的什么性能指標問題上年齡段為46-60,并且手機價格為8000以上;年齡段為15-22;手機價格為2000-4000;手機品牌為華為的人,會看重內存大小這個性能指標。
2)題:“您最看重手機的什么性能指標?”D(外觀)選項的規則分析:
以下6條規則為“您最看重手機的什么性能指標?”D(外觀)選項的規則,正確率為61.93%,下面對每一條規則做出具體分析:
規則1用于0.0:
年齡段在31-45的人;并且手機價格為2000以下,具有以上特征的人,更傾向于在看重手機的什么性能指標問題上不會選擇外觀。
規則2用于0.0:
年齡段在12-22的人;并且手機價格為2000以下,具有以上特征的人,更傾向于在看重手機的什么性能指標問題上不會選擇外觀。
規則3用于0.0:
年齡段在46-60的人,具有以上特征的人,更傾向于在看重手機的什么性能指標問題上不會選擇外觀。
規則4用于0.0:
手機品牌為VIVO,具有以上特征的人,更傾向于在看重手機的什么性能指標問題上不會選擇外觀。
規則5用于0.0: