小議識別網(wǎng)絡(luò)新聞“標題黨”
我們通常認為,在網(wǎng)絡(luò)上,一篇新聞報道要想獲得較高的點擊量,必須有吸引人的標題、優(yōu)質(zhì)的內(nèi)容、廣泛的推廣渠道,相比于內(nèi)容和渠道,對標題的再加工無疑是成本最小、收效最大的。隨著網(wǎng)絡(luò)信息的膨脹與快速變化,僅僅為吸引人眼球的標題黨談不上任何創(chuàng)新創(chuàng)意,也絕無過人之處,有的只是罔顧事實,誤導輿論。網(wǎng)絡(luò)新聞標題黨雖然能夠博人眼球,但是卻失去了新聞報道最重要的功用——保障知情、輿論監(jiān)督、促進公正,對于新聞輿論的公信力也是極大損傷。
本文首先介紹了網(wǎng)絡(luò)新聞標題黨出現(xiàn)的原因及其危害,通過對幾個典型的標題黨新聞的分析來探究標題黨新聞識別技術(shù)的主要目的,介紹當前國內(nèi)主要標題黨新聞識別技術(shù),厘清標題黨新聞識別的主要方法,指出這些方法存在的問題和局限性。最后,針對如何更好地進行標題黨新聞識別提出了一些自己的見解,希望標題黨識別技術(shù)能夠在將來變得更加完善、高效,在一定程度上阻止標題黨新聞的傳播,提高受眾者的閱讀品質(zhì)。
一、何為“標題黨”
眾所周知,標題是新聞的眼睛,在當前信息化快速發(fā)展的時代中,人們接受新聞的方式呈現(xiàn)出多樣性,出現(xiàn)5秒效應(yīng)或者看新聞看題的提法,這種情況下在一定程度上體現(xiàn)出了新聞標題的作用。此外,在網(wǎng)絡(luò)新聞中標題同樣需要加以關(guān)注,只有如此才能讓快速抓住受眾,完成引導活動,形成良好閱讀,換而言之,現(xiàn)階段網(wǎng)絡(luò)新聞的競爭主要體現(xiàn)在網(wǎng)絡(luò)新聞標題的競爭之上。
《現(xiàn)代漢語詞典》(第六版)中并沒有收錄“標題黨”這一詞條。一般認為,“標題黨”是發(fā)端于網(wǎng)絡(luò)論壇,發(fā)帖者為吸引人氣,提高帖子的點擊量而制作博人眼球標題的網(wǎng)絡(luò)貼主群體或行為?!皹祟}黨”可以說是這樣一些信息發(fā)布和轉(zhuǎn)發(fā)行為、人群的總稱。 “標題黨”的目的不是為傳播信息本身,而是為了引起關(guān)注,獲取更多的經(jīng)濟利益。網(wǎng)編們?yōu)榱嗽诤A康男畔⒅挟愜娡黄?獲取點擊率,爭取到好的排位,有更多的廣告收益,紛紛仿效廣告業(yè)“標題黨”的手法將大量新聞標題重新包裝,挖空心思“嘩眾取寵”,大量“題不對文”的新聞標題就此出籠。從特點上分析,標題黨具有兩個特征,第一是夸大性:主要是對文章內(nèi)容進行夸大,以此起到吸引受眾眼球的作用;第二是作假型:標題與文章的內(nèi)容有所差別,內(nèi)容描述的是另外一個事實,但是為了提高受眾的注意力,則將標題設(shè)定為其它內(nèi)容,起到吸引的作用。無論哪一個特點,均在一定程度上反映出了標題黨這種現(xiàn)象沒有遵循新聞的實際情況,也沒有符合新聞發(fā)展的要求,長此久往則會導致新聞呈現(xiàn)出缺陷與不足,甚至在新時期讓人們對新聞形成不良情緒。
二、標題黨新聞識別的必要性
原標題:“大胸”比“平胸”更易患乳癌
記者獲悉,中國女性超過一半是致密性乳腺,患乳腺癌的風險比脂肪性乳腺高4.7倍,而且,密集的腺體易掩蓋早期癌癥病癥。這是因為,亞洲女性的乳房相對較小,且以致密性乳房為主。以致密性乳腺為主的亞洲女性,如果只用手動超聲做為第一線做乳腺癌篩查,可能會存在一定的漏診。
析因:超過50%的中國女性是致密性乳腺
在中國,超過50%的女性具有致密性乳腺。擁有致密性乳腺的女性,相對于脂肪性乳腺的女性,罹患乳腺癌的風險高4.7倍。(節(jié)選)
這種新聞就是典型的“標題黨”!全篇新聞沒有一次出現(xiàn)“大胸”、“平胸”,但在標題中卻出現(xiàn)了“‘大胸’比‘平胸’更容易患乳腺癌”的結(jié)論,簡直是驚為天人。本來一個“中規(guī)中矩”的標題,在他們手下,就變了大樣。 “標題黨”抓住人們“掃視”新聞的這一心理,誤導大眾,不明事實真相的“吃瓜群眾”將這種不經(jīng)過大腦分析的消息通過網(wǎng)絡(luò)傳播給他人,以訛傳訛,謠言就產(chǎn)生了。從另外一個角度分析,如果這種文章傳輸給受眾,則會讓受眾無法辨別其真實性,甚至還會產(chǎn)生抵觸心理,嚴重影響了新聞的真實性以及全面性。除此之外,在當前的發(fā)展背景下,需要清楚的認識到標題黨所帶來的影響,并且能夠從本質(zhì)出發(fā),從新聞識別的方式出發(fā),對標題黨新聞的識別方法進行對比與分析,這樣才能真正提高新聞的可行性以及創(chuàng)新性。
三、標題黨新聞識別方法介紹及對比
1、基于主題句分布的標題黨新聞識別算法
在新聞標題與主題內(nèi)容相關(guān)程度研究方面,國內(nèi)有學者對“標題黨”類新聞的識別進行了研究,王志超提出中提出了一種基于內(nèi)容主題句相似度的“標題黨”新聞識別方法: 首先從正文中提取出可能反映正文主題的句子集合,再分別計算它們與標題的相似度,并以最大相似度作為評價參數(shù)。這種方法歸根到底是網(wǎng)頁信息抽取→主題句提取→句子相似度計算。但這個方法對于“以偏概全”的新聞難以達到較好的識別作用。它對一些同義詞以及未登錄詞、專有名詞無法很好地識別。比如林俊杰演唱會的報道中同時出現(xiàn)“林俊杰”和“JJ”,他們是一個人,但是基于主題句的識別方法認為兩個詞不相關(guān),句子相似度計算出現(xiàn)誤差。這種方法終究沒有避免 TF-IDF只考慮上下文統(tǒng)計特性而不考慮語義信息的局限。漢語句子的表達形式是多種多樣的,如果要準確地刻畫一個句子所表達的意思,還應(yīng)該結(jié)合語法結(jié)構(gòu)信息。所以在進行新聞報道的時候,需要多角度的分析與研究,并且要從本質(zhì)商除法,對主題句分布的標題黨新聞識別加以重視,如此才能實現(xiàn)新聞報道的有效與全面。
2、基于主題詞分布的識別算法
考慮到主題句識別算法的短板,又有學者引入了基于主題詞分布的新聞識別算法。首先從新聞標題中提取出最能反映標題中心含義的主題詞。再分析主題詞在新聞?wù)闹械姆植记闆r,最后根據(jù)分布情況計算出是正常新聞的概率,從而判斷是否為標題黨新聞。這個算法考慮到短語結(jié)構(gòu)分析和依存句法分析,分析句子結(jié)構(gòu)對主題詞集合K的形成提供了幫助。但是這個方法也存在一些問題,根據(jù)依存句法所構(gòu)建的24種關(guān)系詞典都可以進行二次處理嗎?在對多名詞短語處理時如何確定這個名詞短語是否過濾?
北京飯館老板換大招牌迎接奧運
“北京飯館老板”為并列名詞,處理后變?yōu)?“老板換大招牌迎接奧運
萬一作者強調(diào)的重點就是這個“北京老板”喜迎奧運呢?這種情況該如何識別?
3、基于潛在語義的標題黨新聞識別算法
這種標題黨識別技術(shù)以潛在語義分析算法為理論基礎(chǔ)、以矩陣的奇異值分解為核心。這種方法的優(yōu)點有以下幾點:1.可消除無關(guān)詞語的干擾。 2.抽取正文簡單有效。3.從與新聞標題相關(guān)的段落數(shù)占總段數(shù)的比值,以及這些段落內(nèi)容總長度占新聞?wù)目傞L度的比值兩個角度對目標新聞內(nèi)容進行雙重判定。這種方法有是有明顯的局限性的,(1)網(wǎng)頁新聞布局結(jié)構(gòu)造成識別誤差(2)分詞詞典具有局限性,人名、地名、網(wǎng)絡(luò)詞匯等未登錄詞無法正確識別。
從總體上看,這三種方法都有各自明顯的優(yōu)勢和缺點,如果能將主題詞識別新聞技術(shù)和潛在語義識別新聞技術(shù)結(jié)合起來使用,應(yīng)該是很有幫助的。在提取新聞?wù)暮瓦M行分詞的過程中我認為還有一些問題需要注意:
1、 現(xiàn)在的網(wǎng)頁不只包含新聞?wù)?,網(wǎng)頁兩邊還會有廣告,正文下方還會有“相關(guān)推薦”。這部分信息肯定會干擾關(guān)鍵詞的識別,那該如何篩除這部分信息?
2、 在對標題、正文進行切詞時,應(yīng)該采用多種分詞算法相結(jié)合的方法。如切分“北京大學生運動會今日開幕”這樣的句子,可以使用正、逆向最大匹配方法,得到粒度更細的分詞結(jié)果。但是雙向最大匹配無法發(fā)現(xiàn)鏈長為偶數(shù)的交集型歧義,那么可以增加回溯機制。
3、 分詞詞典是進行標標題識別不可缺少的部分,未登錄詞、新詞語、方言詞難以識別是造成識別率較低的原因之一。建立動態(tài)分詞詞典和語料庫就是我們必須要提上日程的事。同時,現(xiàn)在的新聞標題,尤其是網(wǎng)絡(luò)新聞標題中大量使用字母詞,對字母詞的識別也是我們需要注意的。
4、 在《基于潛在語義分析的標題黨新聞識別技術(shù)研究》中,作者使用了基于詞頻統(tǒng)計的方式。但是,僅僅考慮新聞的分詞單位和段落之間的關(guān)系是不夠的,還需要了解分詞單位與其上下文之間的關(guān)系。這時可以利用TF·IDF算法來計算各單位對于各個段落的重要程度。 所以無論從哪一個角度分析,均可以清楚的認識到在網(wǎng)絡(luò)新聞標題是十分關(guān)鍵的,需要多加關(guān)注與研究,加強分析與研究,避免出現(xiàn)標題黨現(xiàn)象的發(fā)生。
四、結(jié)語
總而言之,在當前時代的不斷發(fā)展下,網(wǎng)絡(luò)新聞標題語中存在很多不規(guī)范的地方。這些不規(guī)范的現(xiàn)象產(chǎn)生了許多消極的影響,嚴重破壞了語言的純潔性,尤其是標題黨的出現(xiàn),沒有遵循新聞的基本要求,也沒有從本質(zhì)出發(fā),實現(xiàn)新聞傳播的有效性,故此本文通過對網(wǎng)絡(luò)新聞標題黨識別算法進行簡單分析和比較,對網(wǎng)絡(luò)新聞標題的識別情況有一個整體性的了解和認識,發(fā)現(xiàn)了新聞標題黨識別技術(shù)在使用上存在的一些問題,并提出相關(guān)的意見和建議。雖然現(xiàn)在已經(jīng)出現(xiàn)多種識別網(wǎng)絡(luò)新聞標題黨識別的技術(shù),但是它們都存在或多或少的問題,對于這方面的研究還需要繼續(xù)深入,我們能做的還有很多。
本文來源:《文學教育》:http://00559.cn/w/wy/63.html
- 2023JCR影響因子正式公布!
- 國內(nèi)核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學者
- 我用了一個很復雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- 重磅!CSSCI來源期刊(2023-2024版)最新期刊目錄看點分析!全網(wǎng)首發(fā)!
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個知識點。
- 注意,最新期刊論文格式標準已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學術(shù)論文編寫規(guī)則
- 盤點那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了
- 職稱話題| 為什么黨校更認可省市級黨報?是否有什么說據(jù)?還有哪些機構(gòu)認可黨報?
- 《農(nóng)業(yè)經(jīng)濟》論文投稿解析,難度指數(shù)四顆星,附好發(fā)選題!