《信息組織方法體系》由會員分享,可在線閱讀,更多相關(guān)《信息組織方法體系(45頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、單擊此處編輯母版標(biāo)題樣式,,單擊此處編輯母版文本樣式,,第二級,,第三級,,第四級,,第五級,,,,*,信息組織方法體系,1,信息組織方法體系,一 信息揭示與信息組織,,二 信息組織方法,,三 信息組織手段,2,,一、信息揭示與信息組織,1.信息描述,,2.信息標(biāo)引,,3.信息系統(tǒng)組織,,3,,1.1 信息描述,信息描述(information description),是網(wǎng)絡(luò)時代中學(xué)術(shù)界對傳統(tǒng)“文獻編目”概念的一種繼承和發(fā)展。,,4,,1.1.1 信息描述基本原理,廣義文獻編目包括兩部分:其一是對文獻內(nèi)容的概括和揭示,主要通過分類標(biāo)引和主題標(biāo)引來實現(xiàn);其二是對文獻內(nèi)容和形式特征進行的分
2、析、選擇和記錄,即,著錄,,英美國家所謂的描述性編目(descriptive cataloguing)或?qū)嶓w描述(physical cataloguing)。,5,,在網(wǎng)絡(luò)時代,圖書館所搜集、整理的對象已經(jīng)延伸到了網(wǎng)絡(luò)中的虛擬館藏,網(wǎng)絡(luò)信息已經(jīng)成為了圖書館重要的信息資源?!拔墨I編目”無論從內(nèi)涵還是從外延上講都無法涵蓋現(xiàn)有的圖書館編目對象和編目內(nèi)容。于是出現(xiàn)了“信息描述”、“信息組織”的概念。,6,,信息組織,,就是依據(jù)一定的規(guī)則和方法,將大量原本處于無序狀態(tài)的信息資源(包括實體資源和網(wǎng)絡(luò)資源)有序化,使之形成便于使用的信息系統(tǒng)。這個過程如果針對的是傳統(tǒng)印刷型和非印刷型文獻實體信息資源,仍然可以
3、稱為文獻編目;如果其對象還包括網(wǎng)絡(luò)信息資源,就應(yīng)當(dāng)稱為信息組織。,7,,1.1.2 信息描述的含義,信息組織就內(nèi)容而言,包括,信息標(biāo)引、信息描述和信息排序,。,,信息描述,是根據(jù)一定的規(guī)則和標(biāo)準(zhǔn),對信息資源的形式特征和部分內(nèi)容特征進行描述并給予記錄的過程。其結(jié)果是一條由若干個信息描述項組成的有關(guān)該信息資源的書目數(shù)據(jù)記錄。,,8,,1.1.3 網(wǎng)絡(luò)信息資源描述,A)采用ISBD(國,際標(biāo)準(zhǔn)書目著錄,)格式描述網(wǎng)絡(luò)信息。國際圖聯(lián)(IFLA)1997年為電子信息資源的著錄制定出版了ISBD(ER),對信息資源的獲取增加了獲取方式注明(Mode of Access),可著錄信息獲取的方式及URL地址。
4、,9,,B)采用MARC格式描述網(wǎng)絡(luò)信息。1991年LC提出了討論以USMARC為主要架構(gòu),制定了囊括網(wǎng)絡(luò)信息的相關(guān)字段,以后又不斷修訂。包括擴大網(wǎng)絡(luò)信息資源的涵蓋范圍;增加、修改008字段第26位數(shù)據(jù)元的代碼;5- -相應(yīng)字段增加$u以記錄資源的URL;增設(shè)856電子文件地址與檢索。,,,10,,C)使用專門的網(wǎng)絡(luò)數(shù)據(jù)描述語言進行網(wǎng)絡(luò)信息資源描述。(XML;DC),11,,1.1.4 信息描述的作用和原則,文獻目錄/信息資源數(shù)據(jù)庫的功能。揭示功能;檢索功能;管理功能。,,信息描述的原則??陀^性、實用性、規(guī)范性、制度化。,12,,1.1.5 信息描述理論與實踐的發(fā)展,古代。,,中國,分類目錄,
5、《,七略,》,、,《,四庫全書總目提要,》,,西方,亞歷山大圖書館,《,在全部學(xué)術(shù)領(lǐng)域指引人們寫作之表記,》,;,1548,年,《,編目方法,》,;,1595,年,《,英文印本圖書目錄,》,13,,近現(xiàn)代。,,歐美,,19,世紀(jì)中葉潘尼滋的,《,大英博物館印本圖書著錄規(guī)則,》,被認為是第一部現(xiàn)代編目條例,即,《91,條規(guī)則,》,。博德利與,《,博德利圖書館目錄,》,;朱厄特與,《,朱厄特規(guī)則,》,;克特與,《,印刷本字典式目錄規(guī)則,》,;杜威與,《,美國圖書館協(xié)會編目規(guī)則,》,;德國皇家圖書館,《,普魯士規(guī)則,》,;柳別茨基與巴黎國際編目原則會議的原則聲明;英美編目條例,2,版,。,14,,中
6、國。初創(chuàng)階段,20,世紀(jì)初,-1949,;奠基、發(fā)展、停頓與恢復(fù)階段,1949-1979,;騰飛階段,1979,底,-,。,1979,年,4,月中國加入,ISO,。,《,中國文獻編目規(guī)則,》,、,《,西文文獻編目規(guī)則,》,。,15,,近現(xiàn)代文獻編目的主要理論成就,編目標(biāo)準(zhǔn)化理論:文獻編目條例。,,集中編目理論(,Centralized cataloging,),,,由一個公認的編目中心按照統(tǒng)一的分編規(guī)則編制書目記錄,并向多個文獻收藏機構(gòu)提供書目數(shù)據(jù)的一種編目協(xié)作模式。,,16,,聯(lián)合編目理論(,Cooperative cataloging,),,若干個圖書館根據(jù)協(xié)議和統(tǒng)一的工作規(guī)范,分擔(dān)編目工
7、作,共享編目成果的一種編目形式。,17,,共享編目理論(,Shared cataloging,),,是集中編目和聯(lián)合編目的融合體。以一個權(quán)威機構(gòu)的編目數(shù)據(jù)為主,其他參加機構(gòu)的補充編目數(shù)據(jù)為輔,各參加機構(gòu)通力合作,完成文獻編目,共享編目成果的編目形式。 聯(lián)機共享編目,online shared cataloging,。,,18,,在版編目的理論(,cataloging in publication,CIP,),是一種針對圖書的預(yù)先編目形式。依據(jù)相關(guān)法規(guī),由經(jīng)過授權(quán)的圖書館或其他機構(gòu)在圖書編輯出版過程中根據(jù)出版機構(gòu)所提供的圖書校樣或填報的圖書在版編目數(shù)據(jù)單進行編目,然后再由出版機構(gòu)將編目結(jié)果印刷
8、在圖書的特定位置上的一種編目活動。,19,,書目控制理論(,bibliographic,,control,BC,),,基本含義是針對文獻進行有效的組織與管理。,IFLA1974,年起推行世界書目控制規(guī)劃,UBC,。,制定了,《,個人名稱,》,、,ISBDs,、,采納了,ISBN,、,ISSN,,,推薦了,UNIMARC,、,DDC,。,20,,當(dāng)代的信息描述理論與實踐,“20世紀(jì)以來”,,機讀目錄-增加字段描述文獻網(wǎng)址;元數(shù)據(jù):CDF(頻道定義格式)、CDWA(藝術(shù)作品描述目錄)、CIMI(博物館信息計算機交換標(biāo)準(zhǔn)框架)、,DC(都柏林核心元數(shù)據(jù)),、EAD(檔案編碼描述格式)、GILS(政府
9、信息查找服務(wù)核心元數(shù)據(jù)標(biāo)準(zhǔn))等。,21,,元數(shù)據(jù)(metadata)又稱為“描述數(shù)據(jù)”。即關(guān)于數(shù)據(jù)的數(shù)據(jù),它是對數(shù)據(jù)內(nèi)容的描述,現(xiàn)在常說的元數(shù)據(jù)是特指在標(biāo)記語言(SGML,HTML,XML)環(huán)境下對網(wǎng)絡(luò)信息資源進行描述的解決方案,作用是便于網(wǎng)絡(luò)信息資源的發(fā)現(xiàn)、存儲、管理和檢索利用。,22,,Dublin Core的元數(shù)據(jù)由信息資源的題名、主題、描述、來源、語言、信息資源間的關(guān)系、覆蓋范圍、創(chuàng)建者、出版者、其他信息資源的貢獻者、版權(quán)、日期、信息資源類型、信息資源格式、識別符等15個著錄單元構(gòu)成,并將它們分成內(nèi)容特征、知識產(chǎn)權(quán)和例證說明三大類。,23,,24,,1.2 信息標(biāo)引,,(一)信息標(biāo)引的
10、含義:,,信息標(biāo)引是指在分析文獻內(nèi)容的基礎(chǔ)上,用某種檢索語言把文獻主題以及其他有意義的特征標(biāo)識出來,作為文獻存儲與檢索依據(jù)的一種文獻處理過程。簡單來說,標(biāo)引就是依據(jù)檢索語言,確定文獻標(biāo)識的過程。,,(二)信息標(biāo)引的步驟:,,1.主題分析:,通過討論文獻的中心思想,確定被標(biāo)引文獻的主題概念。,,2.概念轉(zhuǎn)換:,以主題分析為基礎(chǔ),將確定的主題概念賦予檢索標(biāo)識的過程。,,(三)信息標(biāo)引的類型:,,1.分類標(biāo)引:,依據(jù)一定的分類檢索語言,對文獻內(nèi)容的學(xué)科性質(zhì)及其檢索意義的形式特征進行分析、歸納,賦予文獻分類檢索標(biāo)識的過程。,,2.主題標(biāo)引:,依據(jù)一定的主題詞表,對文獻內(nèi)容的先進行主題分析,再賦予文獻詞
11、語標(biāo)識的過程。,25,,自動標(biāo)引,,1.,自動標(biāo)引含義:,是直接通過計算機的操作處理,賦予檢索標(biāo)識的過程。,,2.,自動標(biāo)引的類型,,(1),從標(biāo)引深度劃分:全文自動標(biāo)引和題名自動標(biāo)引;,,(2),從選用的標(biāo)引詞劃分:敘詞自動標(biāo)引和關(guān)鍵詞自動標(biāo)引;,,(3),從標(biāo)引方式劃分:自動賦詞標(biāo)引和自動抽詞標(biāo)引;,,(4),從標(biāo)引形成的標(biāo)識劃分:主題自動標(biāo)引和分類自動標(biāo)引。,,3.,自動標(biāo)引的類型,,統(tǒng)計標(biāo)引法,,語言分析標(biāo)引法,,人工智能標(biāo)引法,26,,1.3 信息系統(tǒng)管理,,信息系統(tǒng)組織是把經(jīng)過描述和標(biāo)引的信息實體和信息記錄組織成一個有序的系統(tǒng),,,,信息通過特征描述和內(nèi)容揭示,獲得了表示信息的標(biāo)引
12、,但這只是針對某一文獻和信息單元的,把這些信息有序地組織起來才完成了信息組織的過程,這就需要信息系統(tǒng)組織。,27,,二 信息組織方法,,2.1 按組織對象分:文獻實體組織與文獻內(nèi)容組織,,文獻實體組織的對象是文獻,書本指的是傳統(tǒng)的信息資源類型,主要指印刷型的出版物,如圖書、期刊、會議論文、科技報告等。文獻實體組織是把這些文獻及其著錄和標(biāo)引記錄組織成一個有序的系統(tǒng)。如圖書館的分類排架系統(tǒng)、分類目錄、主題目錄等。,28,,2.2 按信息組織的層次分:語法信息組織、語義信息組織與語用信息組織,,語法信息組織有:,,字順組織法、代碼組織法、地序組織法、時序組織法。,,29,,2.3 常用信息組織法,1
13、.分類組織法,,2.主題組織法,,3.集成組織法,30,,2.3.1 分類組織法,1)概念:就是根據(jù)分類對象的內(nèi)容性質(zhì)、形式體裁、讀者用途等分門別類地系統(tǒng)地組織事物。—謝陽群 《微觀信息管理》,,2)種類:,,分面分類法和體系分類法,,31,,2.3.2 主題組織法,1)定義:,以自然語言中的詞語或規(guī)范化的詞語作為揭示文獻主題的標(biāo)識,并以此標(biāo)識編排組織和查找文獻的排檢方法。主題詞:表達主題概念的詞語,,優(yōu)選出的詞語必須詞義明確,避免其多義性,并受特定的詞表控制。,,2)分類:,a,標(biāo)題詞法、,b,單元詞法、,c,關(guān)鍵詞法,d,敘詞法,,,32,,a標(biāo)題詞法,a,1,定義:,以標(biāo)題詞,(,規(guī)范的
14、事物名稱、名詞術(shù)語,),作為文獻主題內(nèi)容的標(biāo)識和檢索標(biāo)識的先組式主題法。,,規(guī)范化處理:同義詞(計算機和電腦)、近義詞(實驗與試驗)、詞形(漢字的簡體、繁體、異體)、詞組的組合方式(正敘、倒敘、并列)、用注釋方式對標(biāo)題詞的內(nèi)涵進行限制的規(guī)范,,a,2,標(biāo)題詞表:,《工程標(biāo)題詞表》,(SHE),,,33,,《工程標(biāo)題詞表》,(SHE),①,,INFORMATION SCIENCE,⑥,,903,,,②,(,Before 01/86,use code 901,),,,③,,Abstracting,(,Beginning01/81,),,,③,,Indexing,(,Apply code 723 i
15、f computerized,),⑥,(,723,),,Information Dissemination,④,See,INFORMATION DISSEMINATION,,,,③,,Information Retrieval,(,For systems, see INFORMATION RETRIEVAL SYSTEMS,),,,③,,Information Use Language Translation and Linguistics,⑥,,(,723,),,(,Apply code 723 if computerized.,⑤,See also,TRANSLATING MACHINES
16、,),,說明:①主標(biāo)題詞;②注釋項,說明詞的使用范圍、用法及含義;③副標(biāo)題詞;④見項,指向規(guī)范化的標(biāo)題詞;⑤參見項,指向相關(guān)的標(biāo)題詞;⑥分類號,(,用于計算機檢索)。,,34,,a標(biāo)題詞法,a,3,特點:,,優(yōu)點:,,使檢索具有直接性與直觀性;,,適合于從事物出發(fā)按專題進行特性檢索,,缺點:,,缺乏按學(xué)科進行族性檢索的能力;,,缺乏表述專指度較高的復(fù)雜概念的能力;,,缺乏多途徑檢索和自由擴檢的能力。,35,,b單元詞法,b,1,定義:以單元詞作為文獻主題內(nèi)容的標(biāo)識和檢索標(biāo)識的后組式主題法。,,,,,b,2,單元詞表:,專利工具中的《,WPI,-規(guī)范化主題詞表》,單元詞從文獻內(nèi)容中抽出,再經(jīng)規(guī)范
17、,能表達一個獨立的概念。是最基本的、不能再分的詞匯,比如“計算機軟件”不是單元詞,而“計算機”和“軟件”才是單元詞。,36,,b單元詞法,b,3,特點:,,優(yōu)點:,強調(diào)詞匯的單元化和后期組配,因此,提高了主題法的靈活性;,,缺點:,由于它過分強調(diào),詞匯,單元化,詞匯處理方法又不甚合理,易發(fā)生錯誤組配,誤檢率較高,故實用性不是很好。,,37,,C關(guān)鍵詞法,C,1,定義:,以關(guān)鍵詞作為文獻主題內(nèi)容的標(biāo)識和檢索標(biāo)識的主題法。,,關(guān)鍵詞:直接從文獻題名、文摘或全文中抽取出來的有實際檢索意義的信息單元,(,關(guān)鍵詞,)。,關(guān)鍵詞是非規(guī)范的,無需查閱標(biāo)準(zhǔn)詞表,或者只編制一個“禁用詞表”,它收錄為數(shù)不多的禁用
18、詞,如助詞、連詞、介詞、冠詞以及一些通用概念的詞。,,38,,,c關(guān)鍵詞法,C,2,特點:,,優(yōu)點:關(guān)鍵詞法不受詞表控制,快捷簡便,適于用計算機組織和檢索文獻信息;,,缺點:由于關(guān)鍵詞法的詞語不規(guī)范,影響了文獻信息的查全率和查準(zhǔn)率,。,,39,,d敘詞法,d,1,定義:,以敘詞做主題詞的后組式主題法,,,,,,d,2,敘詞表:,《漢語主題詞表》,,敘詞:是一種以概念為基礎(chǔ)的,經(jīng)過優(yōu)選的規(guī)范化名詞術(shù)語,具有單義性,,組配性能,好的特性。,,40,,D 敘詞法,網(wǎng)羅性高:能形成概念網(wǎng)羅性高的檢索標(biāo)識,概括主題所涉及的各個方面,提高查全率;,,專指度高:能形成專指度高的檢索標(biāo)識,表達主題所包含的復(fù)雜
19、概念,提高查準(zhǔn)率;,,能形成若干檢索標(biāo)識,可進行多途徑檢索;,,完善的參照系統(tǒng),可幫助選準(zhǔn)敘詞,并可進行擴檢和縮檢。,,主題語言按字順排列,其參照系統(tǒng)反映的是直接上下級關(guān)系,所以無法從整體上揭示某一詞族的關(guān)系,因而它所反映的族性關(guān)系不如在體系分類法中表現(xiàn)的充分。,,41,,2.3.4 集成組織法,每種信息組織方法都有其特有的功用,有些組織方法功能是互補的,集成組織法就是將多種方法結(jié)合起來使用會達到更好的效果。,,如分類主題一體化的組織方法、規(guī)范組織方法與自然語言組織方法的結(jié)合。,42,,三 、信息組織手段,,3.1 人工組織,,工分類過程中,人們往往根據(jù)文獻的主題內(nèi)容,以公認的科學(xué)分類體系(如
20、,《杜威十進分類法》,、《國際十進分類法》、《中國圖書資料分類法》等),來決定每篇文獻的分類號??梢哉f,文獻的分類過程,就是人們根據(jù)一定的分類標(biāo)準(zhǔn)給文獻以分類號的過程。,,3.2 自動組織,,計算機輔助編制和管理詞表、自動分類、自動標(biāo)引以及對自然語言的自動處理和理解等。,43,,自動分類,,概念:用計算機系統(tǒng)代替人工對文獻等對象進行分類。一般包含自動聚類與自動歸類。,,自動聚類由計算機系統(tǒng)按照被考察對象的內(nèi)部或外部特征,根據(jù)一定的要求(如類別的數(shù)量限制,同類對象的親近程度等等),將相近、相似或相同特征的對象聚合在一起的過程。目前常用的自動聚類方法有:關(guān)聯(lián)詞法、文獻--文獻相似矩陣法、聚叢法和因子分析法等。自動歸類是指計算機系統(tǒng)按照一定的分類標(biāo)準(zhǔn)或分類參考,將被考察對象劃歸到不同類目的過程。目前常用的自動歸類方法有語義分析法、語法分析法和統(tǒng)計法等。,44,,謝謝,45,,