• <source id="ygue0"><bdo id="ygue0"></bdo></source>
  • <s id="ygue0"></s>
  • 在線客服

    咨詢熱線

    圖形檢索技術在知識產權領域的應用空間探索

    作者:未知

      摘 要:如今隨著知識產權在社會經濟生活中扮演著越來越重要的角色,無論是政府、企業、還是專門從事知識產權業務的事務所和律師事務所,都會越來越頻繁地使用到信息檢索技術來對相關的知識產權數據庫進行檢索。但由于目前該領域所應用的技術僅停留在基于文字和語義來檢索,對于檢索很多以圖形圖像為主要表征的知識產權信息而言效率不高,同時為了得到準確的檢索結果也對檢索人員的技術水平有較多依賴。
      近年來,隨著基于內容的圖形檢索技術發展日趨成熟,已經很大程度上實現了基于圖像的內容對圖像數據庫進行檢索的要求。本文旨在通過將知識產權檢索領域的技術需求特點和圖形檢索技術的發展現狀進行對比分析,進而探索圖形檢索技術在知識產權領域的應用空間、環境條件和愿景。
      關鍵詞:圖形檢索;知識產權;應用分析
      知識產權信息的管理和應用在社會經濟飛速發展的當今世界扮演著越來越重要的角色,并為各國政府、企業所愈發關注和重視。知識產權也逐步發展成為推動科技發展和經濟增長的巨大動力。出于維護自身經濟權利和降低運營風險的需要,越來越多的企業專門組建了知識產權團隊,甚至斥資購買了專門的數據庫系統查詢賬戶,在對企業自有知識產權進行管理之外,利用相關的數據庫系統對其關心的技術點進行檢索排查,以達到降低知識產權侵權的風險,進一步指導產品和技術研發方向。同時也能更好地維護企業和技術人員的合法權益。
      知識產權專業的數據庫系統主要分為政府和商業兩類,前者主要為公眾利益免費對外開放,后者則以企業商戶為服務對象,打造特殊需求的系統產品。不同于其他的數據庫產品,知識產權數據庫有其獨特的屬性:首先,收錄信息全,知識產權系統必須收錄針對某一或某些固定范圍的全面數據,這是知識產權檢索的前提和基礎;其次,知識產權系統檢索,特別是侵權排查檢索,其檢索屬性為查重檢索,即以發現相同或相似數據記錄為目標;再次,即檢索結果的嚴肅性,此類數據檢索結果將直接對企業的研發工作乃至知識產權相關訴訟的結果產生影響。因此,針對服務于知識產權領域的數據庫系統,無論從數據收集,更新頻率,數據加工,檢索方案和交互設計等方面,都提出了很高的要求。
      目前的數據庫產品,如湯森路透公司的Thomson Innovation和律商聯訊公司的Total Patent等專利數據庫,從檢索使用的友好度上,對專利數據進行了不同程度的加工。如為了盡量避免由于用戶關鍵詞選擇不當所導致漏檢,對專利數據中出現的關鍵技術詞匯,進行解釋性改寫,這樣一來將會出現更多詞語表達同一關鍵語義,大大提升了用戶文本檢索的準確程度。
      盡管如此,文本檢索仍然很大程度上依賴于檢索人對于技術的理解和語言的表述能力。對于圖形商標、產品外觀設計以及較難描述的專利描述圖的檢索而言,則帶來了很強的檢索難度。特別是電子商務企業,由于商品種類繁雜,為了保證上架商品的法律安全,不得不花費很大精力變換不同關鍵字和檢索策略,反復進行文本檢索。例如當需要對一款絲網產品進行檢索時,首先需要變換使用mesh, wire, fence等不同關鍵詞進行文本檢索,然后再針對海量的檢索結果中的圖形信息,比照原有的圖形,逐一進行對比分析,但往往收效甚微。此時得以看出,傳統的文本檢索,已經無法滿足這種新型的檢索需求。如果能夠將日趨成熟的圖形檢索技術加以應用,使用戶可以直接輸入圖像,就可以在數據庫系統中對滿足相似度要求的圖像的內容直接進行檢索,相信檢索效率和精度都將大幅度提升。
      有關計算機圖形檢索技術,大致分成兩類,基于文本的圖形檢索(Text-based Retrieval,簡稱CBR)和基于內容的圖形檢索(Content-based Retrieval,簡稱CBR)。其研究早在20世紀70年代就已經開始。在檢索原理上,主要包括三方面:第一,對用戶需求的分析和轉化,形成可以檢索索引數據庫的提問;第二,收集和加工圖像資源,提取圖形特征,分析并進行標引,建立圖像的索引數據庫;第三,根據相似度的算法,計算用戶的提問與索引數據庫中記錄的相似度,然后提取出滿足取值范圍的記錄作為結果輸出,再按照相似度以降序的方式列表輸出顯示。考慮到要保證檢索的精度,許多系統結合相關反饋技術來收集用戶對檢索結果的反饋信息,這在CBIR中顯得更為突出,因為CBIR實現的是逐步求精的圖像檢索過程,在同一次檢索過程中需要不斷地與用戶進行交互。
      基于內容的圖像檢索根據圖像、圖像的內容語義以及語境聯系進行查找,以圖像語義的特征為線索從圖像數據庫中檢出具有相似特性的其它圖像。因為圖像的內容規模一般要大于純文本信息,因此,基于內容的圖像檢索在檢索的速度和效率上要求更高。目前已有很多應用于實踐環境的基于內容的圖像檢索數據系統,如由IBM公司開發的最早商業化QBIC系統,以及由哥倫比亞大學研發的WebSeek系統、麻省理工學院研發的Photobook系統,以及Goodgle公司和Baidu公司推出的圖形內容檢索的產品等。
      從技術層面,一個完整的圖形檢索過程大致包含以下三個步驟。首先,在檢索中要做的就是要對圖形的特征進行提取。可提取的特征可以包括顏色、紋理、平面空間對應關系、外形,或其他數據特征等。 圖像特征的提取與表達是基于內容的圖像檢索技術的基礎。從廣義上講,圖像的特征包括基于文本的特征(如關鍵字、注釋等)和視覺特征(如色彩、紋理、形狀、對象表面等)兩類。視覺特征又可分為通用的視覺特征和領域相關的視覺特征。前者用于描述所有圖像共有的特征,與圖像的具體類型或內容無關,主要包括色彩、紋理和形狀;后者則建立在對所描述圖像內容的某些先驗知識(或假設)的基礎上,與具體的應用緊密有關,例如人的面部特征或指紋特征等。其次就要對檢索過程中算法所依據的相似性進行定義從圖像中提取的特征可以組成一個向量,兩個圖像之間可以通過定義一個距離或者相似性的測量度來計算相似程度。最后,就要彌補語義鴻溝。在傳統的基于文字的查詢技術中,不會存在這個問題,因為查詢關鍵字基本能夠反映查詢意圖。但是在基于內容的圖像查詢中,就存在一個底層特征和上層理解之間的差異。主要原因是底層特征不能完全反映或者匹配查詢意圖。彌補這個鴻溝的技術手段主要有:相關反饋(relevance feedback):按照最初的查詢條件,查詢系統返回給用戶查詢結果,用戶可以人為介入(或者自動)來選擇幾個最符合他查詢意圖的返回結果(正反饋),也可以選擇最不符合他查詢意圖的幾個返回結果(負反饋)。這些反饋信息被送入系統用來更新查詢條件,重新進行查詢。從而讓隨后的搜索更符合查詢者的真實意圖。
      不難看出,雖然圖形檢索的發展,從技術上已經可以滿足知識產權領域的應用需求。但是從原始數據收集的角度看,仍然有很長的路要走。具體說,就是各國政府和相關機構在核準商標、外觀設計、專利等技術文件時,需要對目標項進行統一標準的圖像留檔。如此,才有可能廣泛應用圖形檢索技術,更有效地在世界范圍內推動科技和貿易的健康發展。
    論文來源:《卷宗》 2014年4期
    轉載注明來源:http://www.361tx.com/2/view-12686072.htm

    相關文章

    ?
    天天啪啪,天天啪一啪,天天啪影院,啪啪在线影院免费