信息組織方法體系
單擊此處編輯母版標(biāo)題樣式,,單擊此處編輯母版文本樣式,,第二級(jí),,第三級(jí),,第四級(jí),,第五級(jí),,,,*,信息組織方法體系,1,信息組織方法體系,一 信息揭示與信息組織,,二 信息組織方法,,三 信息組織手段,2,,一、信息揭示與信息組織,1.信息描述,,2.信息標(biāo)引,,3.信息系統(tǒng)組織,,3,,1.1 信息描述,信息描述(information description),是網(wǎng)絡(luò)時(shí)代中學(xué)術(shù)界對(duì)傳統(tǒng)“文獻(xiàn)編目”概念的一種繼承和發(fā)展。,,4,,1.1.1 信息描述基本原理,廣義文獻(xiàn)編目包括兩部分:其一是對(duì)文獻(xiàn)內(nèi)容的概括和揭示,主要通過(guò)分類標(biāo)引和主題標(biāo)引來(lái)實(shí)現(xiàn);其二是對(duì)文獻(xiàn)內(nèi)容和形式特征進(jìn)行的分析、選擇和記錄,即,著錄,,英美國(guó)家所謂的描述性編目(descriptive cataloguing)或?qū)嶓w描述(physical cataloguing)。,5,,在網(wǎng)絡(luò)時(shí)代,圖書(shū)館所搜集、整理的對(duì)象已經(jīng)延伸到了網(wǎng)絡(luò)中的虛擬館藏,網(wǎng)絡(luò)信息已經(jīng)成為了圖書(shū)館重要的信息資源。“文獻(xiàn)編目”無(wú)論從內(nèi)涵還是從外延上講都無(wú)法涵蓋現(xiàn)有的圖書(shū)館編目對(duì)象和編目?jī)?nèi)容。于是出現(xiàn)了“信息描述”、“信息組織”的概念。,6,,信息組織,,就是依據(jù)一定的規(guī)則和方法,將大量原本處于無(wú)序狀態(tài)的信息資源(包括實(shí)體資源和網(wǎng)絡(luò)資源)有序化,使之形成便于使用的信息系統(tǒng)。這個(gè)過(guò)程如果針對(duì)的是傳統(tǒng)印刷型和非印刷型文獻(xiàn)實(shí)體信息資源,仍然可以稱為文獻(xiàn)編目;如果其對(duì)象還包括網(wǎng)絡(luò)信息資源,就應(yīng)當(dāng)稱為信息組織。,7,,1.1.2 信息描述的含義,信息組織就內(nèi)容而言,包括,信息標(biāo)引、信息描述和信息排序,。,,信息描述,是根據(jù)一定的規(guī)則和標(biāo)準(zhǔn),對(duì)信息資源的形式特征和部分內(nèi)容特征進(jìn)行描述并給予記錄的過(guò)程。其結(jié)果是一條由若干個(gè)信息描述項(xiàng)組成的有關(guān)該信息資源的書(shū)目數(shù)據(jù)記錄。,,8,,1.1.3 網(wǎng)絡(luò)信息資源描述,A)采用ISBD(國(guó),際標(biāo)準(zhǔn)書(shū)目著錄,)格式描述網(wǎng)絡(luò)信息。國(guó)際圖聯(lián)(IFLA)1997年為電子信息資源的著錄制定出版了ISBD(ER),對(duì)信息資源的獲取增加了獲取方式注明(Mode of Access),可著錄信息獲取的方式及URL地址。,9,,B)采用MARC格式描述網(wǎng)絡(luò)信息。1991年LC提出了討論以USMARC為主要架構(gòu),制定了囊括網(wǎng)絡(luò)信息的相關(guān)字段,以后又不斷修訂。包括擴(kuò)大網(wǎng)絡(luò)信息資源的涵蓋范圍;增加、修改008字段第26位數(shù)據(jù)元的代碼;5- -相應(yīng)字段增加$u以記錄資源的URL;增設(shè)856電子文件地址與檢索。,,,10,,C)使用專門(mén)的網(wǎng)絡(luò)數(shù)據(jù)描述語(yǔ)言進(jìn)行網(wǎng)絡(luò)信息資源描述。(XML;DC),11,,1.1.4 信息描述的作用和原則,文獻(xiàn)目錄/信息資源數(shù)據(jù)庫(kù)的功能。揭示功能;檢索功能;管理功能。,,信息描述的原則??陀^性、實(shí)用性、規(guī)范性、制度化。,12,,1.1.5 信息描述理論與實(shí)踐的發(fā)展,古代。,,中國(guó),分類目錄,《,七略,》,、,《,四庫(kù)全書(shū)總目提要,》,,西方,亞歷山大圖書(shū)館,《,在全部學(xué)術(shù)領(lǐng)域指引人們寫(xiě)作之表記,》,;,1548,年,《,編目方法,》,;,1595,年,《,英文印本圖書(shū)目錄,》,13,,近現(xiàn)代。,,歐美,,19,世紀(jì)中葉潘尼滋的,《,大英博物館印本圖書(shū)著錄規(guī)則,》,被認(rèn)為是第一部現(xiàn)代編目條例,即,《91,條規(guī)則,》,。博德利與,《,博德利圖書(shū)館目錄,》,;朱厄特與,《,朱厄特規(guī)則,》,;克特與,《,印刷本字典式目錄規(guī)則,》,;杜威與,《,美國(guó)圖書(shū)館協(xié)會(huì)編目規(guī)則,》,;德國(guó)皇家圖書(shū)館,《,普魯士規(guī)則,》,;柳別茨基與巴黎國(guó)際編目原則會(huì)議的原則聲明;英美編目條例,2,版,。,14,,中國(guó)。初創(chuàng)階段,20,世紀(jì)初,-1949,;奠基、發(fā)展、停頓與恢復(fù)階段,1949-1979,;騰飛階段,1979,底,-,。,1979,年,4,月中國(guó)加入,ISO,。,《,中國(guó)文獻(xiàn)編目規(guī)則,》,、,《,西文文獻(xiàn)編目規(guī)則,》,。,15,,近現(xiàn)代文獻(xiàn)編目的主要理論成就,編目標(biāo)準(zhǔn)化理論:文獻(xiàn)編目條例。,,集中編目理論(,Centralized cataloging,),,,由一個(gè)公認(rèn)的編目中心按照統(tǒng)一的分編規(guī)則編制書(shū)目記錄,并向多個(gè)文獻(xiàn)收藏機(jī)構(gòu)提供書(shū)目數(shù)據(jù)的一種編目協(xié)作模式。,,16,,聯(lián)合編目理論(,Cooperative cataloging,),,若干個(gè)圖書(shū)館根據(jù)協(xié)議和統(tǒng)一的工作規(guī)范,分擔(dān)編目工作,共享編目成果的一種編目形式。,17,,共享編目理論(,Shared cataloging,),,是集中編目和聯(lián)合編目的融合體。以一個(gè)權(quán)威機(jī)構(gòu)的編目數(shù)據(jù)為主,其他參加機(jī)構(gòu)的補(bǔ)充編目數(shù)據(jù)為輔,各參加機(jī)構(gòu)通力合作,完成文獻(xiàn)編目,共享編目成果的編目形式。 聯(lián)機(jī)共享編目,online shared cataloging,。,,18,,在版編目的理論(,cataloging in publication,CIP,),是一種針對(duì)圖書(shū)的預(yù)先編目形式。依據(jù)相關(guān)法規(guī),由經(jīng)過(guò)授權(quán)的圖書(shū)館或其他機(jī)構(gòu)在圖書(shū)編輯出版過(guò)程中根據(jù)出版機(jī)構(gòu)所提供的圖書(shū)校樣或填報(bào)的圖書(shū)在版編目數(shù)據(jù)單進(jìn)行編目,然后再由出版機(jī)構(gòu)將編目結(jié)果印刷在圖書(shū)的特定位置上的一種編目活動(dòng)。,19,,書(shū)目控制理論(,bibliographic,,control,BC,),,基本含義是針對(duì)文獻(xiàn)進(jìn)行有效的組織與管理。,IFLA1974,年起推行世界書(shū)目控制規(guī)劃,UBC,。,制定了,《,個(gè)人名稱,》,、,ISBDs,、,采納了,ISBN,、,ISSN,,,推薦了,UNIMARC,、,DDC,。,20,,當(dāng)代的信息描述理論與實(shí)踐,“20世紀(jì)以來(lái)”,,機(jī)讀目錄-增加字段描述文獻(xiàn)網(wǎng)址;元數(shù)據(jù):CDF(頻道定義格式)、CDWA(藝術(shù)作品描述目錄)、CIMI(博物館信息計(jì)算機(jī)交換標(biāo)準(zhǔn)框架)、,DC(都柏林核心元數(shù)據(jù)),、EAD(檔案編碼描述格式)、GILS(政府信息查找服務(wù)核心元數(shù)據(jù)標(biāo)準(zhǔn))等。,21,,元數(shù)據(jù)(metadata)又稱為“描述數(shù)據(jù)”。即關(guān)于數(shù)據(jù)的數(shù)據(jù),它是對(duì)數(shù)據(jù)內(nèi)容的描述,現(xiàn)在常說(shuō)的元數(shù)據(jù)是特指在標(biāo)記語(yǔ)言(SGML,HTML,XML)環(huán)境下對(duì)網(wǎng)絡(luò)信息資源進(jìn)行描述的解決方案,作用是便于網(wǎng)絡(luò)信息資源的發(fā)現(xiàn)、存儲(chǔ)、管理和檢索利用。,22,,Dublin Core的元數(shù)據(jù)由信息資源的題名、主題、描述、來(lái)源、語(yǔ)言、信息資源間的關(guān)系、覆蓋范圍、創(chuàng)建者、出版者、其他信息資源的貢獻(xiàn)者、版權(quán)、日期、信息資源類型、信息資源格式、識(shí)別符等15個(gè)著錄單元構(gòu)成,并將它們分成內(nèi)容特征、知識(shí)產(chǎn)權(quán)和例證說(shuō)明三大類。,23,,24,,1.2 信息標(biāo)引,,(一)信息標(biāo)引的含義:,,信息標(biāo)引是指在分析文獻(xiàn)內(nèi)容的基礎(chǔ)上,用某種檢索語(yǔ)言把文獻(xiàn)主題以及其他有意義的特征標(biāo)識(shí)出來(lái),作為文獻(xiàn)存儲(chǔ)與檢索依據(jù)的一種文獻(xiàn)處理過(guò)程。簡(jiǎn)單來(lái)說(shuō),標(biāo)引就是依據(jù)檢索語(yǔ)言,確定文獻(xiàn)標(biāo)識(shí)的過(guò)程。,,(二)信息標(biāo)引的步驟:,,1.主題分析:,通過(guò)討論文獻(xiàn)的中心思想,確定被標(biāo)引文獻(xiàn)的主題概念。,,2.概念轉(zhuǎn)換:,以主題分析為基礎(chǔ),將確定的主題概念賦予檢索標(biāo)識(shí)的過(guò)程。,,(三)信息標(biāo)引的類型:,,1.分類標(biāo)引:,依據(jù)一定的分類檢索語(yǔ)言,對(duì)文獻(xiàn)內(nèi)容的學(xué)科性質(zhì)及其檢索意義的形式特征進(jìn)行分析、歸納,賦予文獻(xiàn)分類檢索標(biāo)識(shí)的過(guò)程。,,2.主題標(biāo)引:,依據(jù)一定的主題詞表,對(duì)文獻(xiàn)內(nèi)容的先進(jìn)行主題分析,再賦予文獻(xiàn)詞語(yǔ)標(biāo)識(shí)的過(guò)程。,25,,自動(dòng)標(biāo)引,,1.,自動(dòng)標(biāo)引含義:,是直接通過(guò)計(jì)算機(jī)的操作處理,賦予檢索標(biāo)識(shí)的過(guò)程。,,2.,自動(dòng)標(biāo)引的類型,,(1),從標(biāo)引深度劃分:全文自動(dòng)標(biāo)引和題名自動(dòng)標(biāo)引;,,(2),從選用的標(biāo)引詞劃分:敘詞自動(dòng)標(biāo)引和關(guān)鍵詞自動(dòng)標(biāo)引;,,(3),從標(biāo)引方式劃分:自動(dòng)賦詞標(biāo)引和自動(dòng)抽詞標(biāo)引;,,(4),從標(biāo)引形成的標(biāo)識(shí)劃分:主題自動(dòng)標(biāo)引和分類自動(dòng)標(biāo)引。,,3.,自動(dòng)標(biāo)引的類型,,統(tǒng)計(jì)標(biāo)引法,,語(yǔ)言分析標(biāo)引法,,人工智能標(biāo)引法,26,,1.3 信息系統(tǒng)管理,,信息系統(tǒng)組織是把經(jīng)過(guò)描述和標(biāo)引的信息實(shí)體和信息記錄組織成一個(gè)有序的系統(tǒng),,,,信息通過(guò)特征描述和內(nèi)容揭示,獲得了表示信息的標(biāo)引,但這只是針對(duì)某一文獻(xiàn)和信息單元的,把這些信息有序地組織起來(lái)才完成了信息組織的過(guò)程,這就需要信息系統(tǒng)組織。,27,,二 信息組織方法,,2.1 按組織對(duì)象分:文獻(xiàn)實(shí)體組織與文獻(xiàn)內(nèi)容組織,,文獻(xiàn)實(shí)體組織的對(duì)象是文獻(xiàn),書(shū)本指的是傳統(tǒng)的信息資源類型,主要指印刷型的出版物,如圖書(shū)、期刊、會(huì)議論文、科技報(bào)告等。文獻(xiàn)實(shí)體組織是把這些文獻(xiàn)及其著錄和標(biāo)引記錄組織成一個(gè)有序的系統(tǒng)。如圖書(shū)館的分類排架系統(tǒng)、分類目錄、主題目錄等。,28,,2.2 按信息組織的層次分:語(yǔ)法信息組織、語(yǔ)義信息組織與語(yǔ)用信息組織,,語(yǔ)法信息組織有:,,字順組織法、代碼組織法、地序組織法、時(shí)序組織法。,,29,,2.3 常用信息組織法,1.分類組織法,,2.主題組織法,,3.集成組織法,30,,2.3.1 分類組織法,1)概念:就是根據(jù)分類對(duì)象的內(nèi)容性質(zhì)、形式體裁、讀者用途等分門(mén)別類地系統(tǒng)地組織事物?!x陽(yáng)群 《微觀信息管理》,,2)種類:,,分面分類法和體系分類法,,31,,2.3.2 主題組織法,1)定義:,以自然語(yǔ)言中的詞語(yǔ)或規(guī)范化的詞語(yǔ)作為揭示文獻(xiàn)主題的標(biāo)識(shí),并以此標(biāo)識(shí)編排組織和查找文獻(xiàn)的排檢方法。主題詞:表達(dá)主題概念的詞語(yǔ),,優(yōu)選出的詞語(yǔ)必須詞義明確,避免其多義性,并受特定的詞表控制。,,2)分類:,a,標(biāo)題詞法、,b,單元詞法、,c,關(guān)鍵詞法,d,敘詞法,,,32,,a標(biāo)題詞法,a,1,定義:,以標(biāo)題詞,(,規(guī)范的事物名稱、名詞術(shù)語(yǔ),),作為文獻(xiàn)主題內(nèi)容的標(biāo)識(shí)和檢索標(biāo)識(shí)的先組式主題法。,,規(guī)范化處理:同義詞(計(jì)算機(jī)和電腦)、近義詞(實(shí)驗(yàn)與試驗(yàn))、詞形(漢字的簡(jiǎn)體、繁體、異體)、詞組的組合方式(正敘、倒敘、并列)、用注釋方式對(duì)標(biāo)題詞的內(nèi)涵進(jìn)行限制的規(guī)范,,a,2,標(biāo)題詞表:,《工程標(biāo)題詞表》,(SHE),,,33,,《工程標(biāo)題詞表》,(SHE),①,,INFORMATION SCIENCE,⑥,,903,,,②,(,Before 01/86,use code 901,),,,③,,Abstracting,(,Beginning01/81,),,,③,,Indexing,(,Apply code 723 if computerized,),⑥,(,723,),,Information Dissemination,④,See,INFORMATION DISSEMINATION,,,,③,,Information Retrieval,(,For systems, see INFORMATION RETRIEVAL SYSTEMS,),,,③,,Information Use Language Translation and Linguistics,⑥,,(,723,),,(,Apply code 723 if computerized.,⑤,See also,TRANSLATING MACHINES,),,說(shuō)明:①主標(biāo)題詞;②注釋項(xiàng),說(shuō)明詞的使用范圍、用法及含義;③副標(biāo)題詞;④見(jiàn)項(xiàng),指向規(guī)范化的標(biāo)題詞;⑤參見(jiàn)項(xiàng),指向相關(guān)的標(biāo)題詞;⑥分類號(hào),(,用于計(jì)算機(jī)檢索)。,,34,,a標(biāo)題詞法,a,3,特點(diǎn):,,優(yōu)點(diǎn):,,使檢索具有直接性與直觀性;,,適合于從事物出發(fā)按專題進(jìn)行特性檢索,,缺點(diǎn):,,缺乏按學(xué)科進(jìn)行族性檢索的能力;,,缺乏表述專指度較高的復(fù)雜概念的能力;,,缺乏多途徑檢索和自由擴(kuò)檢的能力。,35,,b單元詞法,b,1,定義:以單元詞作為文獻(xiàn)主題內(nèi)容的標(biāo)識(shí)和檢索標(biāo)識(shí)的后組式主題法。,,,,,b,2,單元詞表:,專利工具中的《,WPI,-規(guī)范化主題詞表》,單元詞從文獻(xiàn)內(nèi)容中抽出,再經(jīng)規(guī)范,能表達(dá)一個(gè)獨(dú)立的概念。是最基本的、不能再分的詞匯,比如“計(jì)算機(jī)軟件”不是單元詞,而“計(jì)算機(jī)”和“軟件”才是單元詞。,36,,b單元詞法,b,3,特點(diǎn):,,優(yōu)點(diǎn):,強(qiáng)調(diào)詞匯的單元化和后期組配,因此,提高了主題法的靈活性;,,缺點(diǎn):,由于它過(guò)分強(qiáng)調(diào),詞匯,單元化,詞匯處理方法又不甚合理,易發(fā)生錯(cuò)誤組配,誤檢率較高,故實(shí)用性不是很好。,,37,,C關(guān)鍵詞法,C,1,定義:,以關(guān)鍵詞作為文獻(xiàn)主題內(nèi)容的標(biāo)識(shí)和檢索標(biāo)識(shí)的主題法。,,關(guān)鍵詞:直接從文獻(xiàn)題名、文摘或全文中抽取出來(lái)的有實(shí)際檢索意義的信息單元,(,關(guān)鍵詞,)。,關(guān)鍵詞是非規(guī)范的,無(wú)需查閱標(biāo)準(zhǔn)詞表,或者只編制一個(gè)“禁用詞表”,它收錄為數(shù)不多的禁用詞,如助詞、連詞、介詞、冠詞以及一些通用概念的詞。,,38,,,c關(guān)鍵詞法,C,2,特點(diǎn):,,優(yōu)點(diǎn):關(guān)鍵詞法不受詞表控制,快捷簡(jiǎn)便,適于用計(jì)算機(jī)組織和檢索文獻(xiàn)信息;,,缺點(diǎn):由于關(guān)鍵詞法的詞語(yǔ)不規(guī)范,影響了文獻(xiàn)信息的查全率和查準(zhǔn)率,。,,39,,d敘詞法,d,1,定義:,以敘詞做主題詞的后組式主題法,,,,,,d,2,敘詞表:,《漢語(yǔ)主題詞表》,,敘詞:是一種以概念為基礎(chǔ)的,經(jīng)過(guò)優(yōu)選的規(guī)范化名詞術(shù)語(yǔ),具有單義性,,組配性能,好的特性。,,40,,D 敘詞法,網(wǎng)羅性高:能形成概念網(wǎng)羅性高的檢索標(biāo)識(shí),概括主題所涉及的各個(gè)方面,提高查全率;,,專指度高:能形成專指度高的檢索標(biāo)識(shí),表達(dá)主題所包含的復(fù)雜概念,提高查準(zhǔn)率;,,能形成若干檢索標(biāo)識(shí),可進(jìn)行多途徑檢索;,,完善的參照系統(tǒng),可幫助選準(zhǔn)敘詞,并可進(jìn)行擴(kuò)檢和縮檢。,,主題語(yǔ)言按字順排列,其參照系統(tǒng)反映的是直接上下級(jí)關(guān)系,所以無(wú)法從整體上揭示某一詞族的關(guān)系,因而它所反映的族性關(guān)系不如在體系分類法中表現(xiàn)的充分。,,41,,2.3.4 集成組織法,每種信息組織方法都有其特有的功用,有些組織方法功能是互補(bǔ)的,集成組織法就是將多種方法結(jié)合起來(lái)使用會(huì)達(dá)到更好的效果。,,如分類主題一體化的組織方法、規(guī)范組織方法與自然語(yǔ)言組織方法的結(jié)合。,42,,三 、信息組織手段,,3.1 人工組織,,工分類過(guò)程中,人們往往根據(jù)文獻(xiàn)的主題內(nèi)容,以公認(rèn)的科學(xué)分類體系(如,《杜威十進(jìn)分類法》,、《國(guó)際十進(jìn)分類法》、《中國(guó)圖書(shū)資料分類法》等),來(lái)決定每篇文獻(xiàn)的分類號(hào)??梢哉f(shuō),文獻(xiàn)的分類過(guò)程,就是人們根據(jù)一定的分類標(biāo)準(zhǔn)給文獻(xiàn)以分類號(hào)的過(guò)程。,,3.2 自動(dòng)組織,,計(jì)算機(jī)輔助編制和管理詞表、自動(dòng)分類、自動(dòng)標(biāo)引以及對(duì)自然語(yǔ)言的自動(dòng)處理和理解等。,43,,自動(dòng)分類,,概念:用計(jì)算機(jī)系統(tǒng)代替人工對(duì)文獻(xiàn)等對(duì)象進(jìn)行分類。一般包含自動(dòng)聚類與自動(dòng)歸類。,,自動(dòng)聚類由計(jì)算機(jī)系統(tǒng)按照被考察對(duì)象的內(nèi)部或外部特征,根據(jù)一定的要求(如類別的數(shù)量限制,同類對(duì)象的親近程度等等),將相近、相似或相同特征的對(duì)象聚合在一起的過(guò)程。目前常用的自動(dòng)聚類方法有:關(guān)聯(lián)詞法、文獻(xiàn)--文獻(xiàn)相似矩陣法、聚叢法和因子分析法等。自動(dòng)歸類是指計(jì)算機(jī)系統(tǒng)按照一定的分類標(biāo)準(zhǔn)或分類參考,將被考察對(duì)象劃歸到不同類目的過(guò)程。目前常用的自動(dòng)歸類方法有語(yǔ)義分析法、語(yǔ)法分析法和統(tǒng)計(jì)法等。,44,,謝謝,45,,