武佳琪


摘 要:婚姻的本質是一種人際關系,是兩個親密的人搭建的關系連接。但近年來,我國離婚率逐步升高,如今已成為一種引人重視、令人不安的社會現象。離結比是對離婚率的一種特征描述,本文采用Apriori算法對所采集的數據進行處理,探究其中相關因素。
關鍵詞:Apriori算法;離結比;離婚率
1離結比影響因素
現今的學術研究中對離婚率有多種特征描述,其中最主要的為離結比,即為單位時間內人們離婚登記對數與結婚登記對數之比。隨著經濟體制的改革和社會的進步發展,人們的婚姻關系被多種因素綜合作用。
▲流動人口規模的擴大給許多婚姻家庭帶來很多不穩定因素,如不經常的溝通會導致各種家庭矛盾,以至于雙方矛盾被放大,從而很可能導致離婚。
▲子女永遠是婚姻中重要的紐帶,如果一個家庭里的子女數量較少,那么雙方在處理婚姻問題的過程中來自孩子的牽絆更少[1],這也是部分地區的離結比高于其他地區的重要原因。
▲新時代女性越來越重視知識的學習,從而使其經濟逐步走向獨立,在婚姻中受感情以外因素的制約越來越小。因此,當雙方賴以維系的感情基礎消磨殆盡時,女性因為經濟原因委曲求全的可能性降低,而更傾向于結束婚姻關系[2]。
2Apriori算法應用
2.1事務數據庫
事務數據庫的定義是生成關聯規則的基礎,根據搜集的數據材料,將教育質量排到全國前15名(事件a)、生育率小于等于1.050(事件b)、離結比超過45%(事件c)作為事件,經過篩選后得到各個省份的事務,建立如下表所示的事務數據庫。
表1事務數據庫
地區 教育質量排名 生育率 離結比
北京 1 0.707 48%
江蘇 2
上海 3 0.737 49%
湖北 4
山東 9
廣東 5
浙江 7 1.017
遼寧 10 0.741 54%
陜西 6
2.2頻繁項目集
定義1:對于項目集I和事務數據庫D,在T中所有滿足指定的最小支持度的項目集稱為頻繁項目集,并且在其中挑選出所有不被其他元素包含的頻繁項目集稱為最大頻繁項目集。
充分考慮各個地區的具體情況,將事務數據庫的最小支持度定義為6,根據最終整理好的事務數據庫,得到minsupport=6/16,生成候選集并通過掃描數據庫首先得到支持數C,然后挑選出minsup_count≥6/16的項目集組成頻繁項目集L。
▲C1={(a,15),(b,7),(c,7)};L1={a,b,c}。
▲C2={(ab,7),(ac,7),(bc,6)};L2={ab,ac,bc}。
▲C3={(abc,6)};L3={abc}。
▲C4=?;L4=?。
得到所有的頻繁項目集為{a,b,c,ab,ac,bc,abc},得到最大頻繁項目集為{abc}。下面跟蹤關聯規則的執行過程(設minconfidence=70%)
定義2:對于事件A與事件B
關聯規則的支持度:
support=P(A∪B) (1)
關聯規則的置信度:
confidence=support=P(A∪B)/support(A) (2)
表2關聯規則生成過程示意
序號 lk xm-1 confidence support 規則(是否是強規則)
1 abc a 40% 70% a→abc(否)
2 abc b 85% 70% b→abc(是)
3 abc c 85% 70% c→abc(是)
4 abc ab 85% 70% ab→abc(是)
5 abc ac 85% 70% ac→abc(是)
6 abc bc 100% 70% bc→abc(是)
每個地區離結比不同,影響離結比的因素也有多種,有點地區受人文因素影響,也有地區是因為人口流動等,由上表可以得出生育率和受教育水平與地區的離結比有著較強的關聯度。
3結束語
家庭是社會和諧穩定的基礎,如果家庭不穩定將會影響社會秩序。離婚的現象隨著社會經濟的發展不斷涌現,這可能會解除一些人的痛苦,但可能會導致房價的漲跌、社會生育率的高低甚至是老齡化的快慢,現如今離婚已不再是個人問題, 而是一個社會問題[3]。
參考文獻
[1]劉娟.從責任角度探究農村離婚的原因[J].法制與社會,2017(22):156-157.
[2]李雨潼,楊竹.東北地區離婚率特征分析及原因思考[J].人口學刊,2011(03):47-52.
[3]付琳,王麗華.降低我國離婚率的立法對策探析[J].法制與社會,2013(31):280-281.