企業(yè)做網(wǎng)站識別商品屬性信息設計

檢索電子商務網(wǎng)頁中商品屬性特征詞典中的每一個詞匯,若找到相配詞匯,則將該詞匯所在節(jié)點添加到候選集合中。再對后先集合中的每一個節(jié)點中,查詢與其距離最近的上一級別的節(jié)點,若未能成功找到則將該節(jié)點排除,若能夠找到則從上一級別的節(jié)點集合中將屬于該節(jié)點的子節(jié)點刪除。

利用統(tǒng)計學的規(guī)則,并結合提取規(guī)則,計算出節(jié)點中的表格子節(jié)點以及文本內容的子節(jié)點,并通過計算獲得其數(shù)量的所占比例,若比值大于75%,則將該節(jié)點加入到提取集合當中,若小于75%,則將該節(jié)點排除。