基于內(nèi)容的檢索方法要求數(shù)據(jù)庫系統(tǒng)能夠?qū)Χ嗝襟w數(shù)據(jù)進(jìn)行內(nèi)容語義分析,以達(dá)到更深的檢索層次因此,它具有如下特點(diǎn):
(1)從媒體內(nèi)容中提取信息線索?;趦?nèi)容的檢索突破了傳統(tǒng)的基于關(guān)鍵詞檢索的局限,直接對(duì)圖像、視頻、音頻進(jìn)行分析,抽取特征,使得檢索更加接近媒體對(duì)象。
(2)提取特征的方法多種多樣。以圖像的特征提取為例,可以提取形狀特征、顏色特征、紋理特征、輪廓特征等。
(3)人機(jī)交互進(jìn)行。一般來講,人對(duì)于特征比較敏感,能迅速分出目標(biāo)的輪廓、音樂的旋律等,但對(duì)于大量的對(duì)象,一方面難以記住這些特征,另一方面人工從大量數(shù)據(jù)中查找目標(biāo)效率非常低,而這正是計(jì)算機(jī)的長(zhǎng)處。因此,使用基于內(nèi)容檢索的系統(tǒng)時(shí),人與計(jì)算機(jī)相互分工匹配進(jìn)行檢索。
(4)基于內(nèi)容的檢索是一種近似匹配。在檢索過程中,采用逐步求精的辦法,每一層的中間結(jié)果是一個(gè)集合,不斷減小集合的范圍,直到定位到目標(biāo)。這一點(diǎn)與數(shù)據(jù)庫檢索的精確匹配算法有明顯不同。
基于內(nèi)容的檢索涉及圖像處理、語音信號(hào)處理、模式識(shí)別、計(jì)算機(jī)視覺等方面的知識(shí)。它不僅僅是簡(jiǎn)單地基于內(nèi)容,它利用認(rèn)知科學(xué)、用戶模型、圖像處理、模式識(shí)別、知識(shí)庫系統(tǒng)、計(jì)算機(jī)圖形學(xué)、數(shù)據(jù)庫管理系統(tǒng)、信息檢索等領(lǐng)域的研究成果和方法,研究新的媒體數(shù)據(jù)的表示和數(shù)據(jù)模型、有效和可靠地查詢處理算法、智能查詢接口以及與應(yīng)用領(lǐng)域無關(guān)的系統(tǒng)結(jié)構(gòu)。因此,基于內(nèi)容的檢索是一種信息檢索技術(shù)。它能夠從大型分布式數(shù)據(jù)庫中以用戶可以接受的相應(yīng)時(shí)間查詢到要求的信息。它不一定需要去理解和識(shí)別媒體中的目標(biāo),關(guān)注的是以基于內(nèi)容或特征的方法快速發(fā)現(xiàn)信息。
內(nèi)容來源:張濤《多媒體技術(shù)與虛擬現(xiàn)實(shí)》