從使用者需求與文獻特性看圖書館界資訊組織模式發展趨勢

A Study of Information Organization Model from the User's Need and Documentation Characteristics

陳昭珍 Chao-chen Chen

國立師範大學社會教育學系副教授

Associate Professor

Department of Adult and Continuing Education

National Taiwan Normal University

 


資訊為何要被組織?最主要的目的是為滿足相關使用需求。使用者有不同層級之資訊需求﹐如:檢索需求﹑管理需求﹑保存需求等。不同的資訊亦有不同的文獻特質﹐如地理資訊﹑博物館資訊﹑科技文獻﹑文學創作﹑音樂作品等﹐均各有其不同之文獻結構﹑媒體特性﹑使用習性﹐是以當我們在做資訊組織時﹐應從使用需求與文獻特質二個角度思考適合的組織方法。本文試從此一觀點﹐分析圖書館資訊組織模式之使用需求與文獻特質﹐並歸納出一些想法供圖書資訊界未來規畫之參考。

Abstract

The main purpose for organizing information according to retrieval, management, preservation is to accommodate the various needs of the users. The structure of documentation, media characteristics and user's behavior also determine the organization of information. Hence an analysis of the organization model of libraries will provide some suggestions for the library community.

關鍵字: 資訊組織﹐使用需求﹐文獻特性﹐metadata

Keywords: Information organization; Information needs;

Document characteristic; Metadata

 

 

一、決定資訊組織模式的二個重要因素

設計任何資訊系統時,首先需決定的是其資訊該如何組織,資訊組織方式決定了系統之資料庫架構,而影響資訊組織的三個重要因素則是: 使用者需求、文獻特性、及為了資訊單位間之合作分享而必要的標準化。若我們將「使用者」做廣義解,則事實上,也可以將合作分享歸類為使用者需求的一種。所以當一資訊系統開始設計時,必先分析其使用者需求(含資

料單位間資料交換之需求)、文獻特性,並據以決定該領域或該類資料應採 用之資訊組織模式﹐這種情況我們可以從CIMIDublin CoreEAD等等設計實例清楚得知。而圖書館界所用之編目規則更是經過長久的分析而有的成果,到底這種資訊組織模式所欲滿足之使用者需求與所掌握之文獻特性為何?是否需用到不同的資訊組織模式?不同的模式間是否需互通?這是本文希望能闡釋的重點。

二、圖書館界的資訊組織模式之使用者需求與文獻特性

使用者需求是資訊組織的目的,卻也是最難掌握的目的。因為所謂的使用者,可以大至整個學科領域的需求,也可以小至個人的需求,可以是創作該類資訊的專家學者之需求,也可能是偶而涉略的一般讀者之需求,可能是成人的需求,也可能是兒童的需求。有的系統可能只需滿足一小部份人的需求,有的系統則需滿足所有人的需求,前者之需求較易掌握,可以採用問卷、訪問等方式得知,而後者則較難精確的掌握。除了使用者類型相當多元外,所謂的「需求」也是類型紛歧。對一般人而言,資訊的使用需求是為滿足其求知、決策等目的,若對資料收藏單位而言,則有分享、保存之需求,而對系統人員而言,可能還有管理、服務、資料交換等之需求。文獻特性乃針對系統所要處理的對象而言,有的系統所要處理的只限某領域(如博物館資訊)或某類型之資訊(如地理資料),有的系統則欲處理所有類型之資料,如圖書館的編目規則及機讀格式。茲以圖書館界之書目工作為例,詳細說明這類系統欲滿足之資訊需求及其所掌握的文獻特性。

使用者資訊需求

使用者資訊需求可分為資訊查尋檢索需求﹑資訊分享館際合作之需求﹑ 流通之需求﹑開架瀏覽之需求﹑保存典藏之需求。檢索需求又可從兩個角度來分析﹐一是單一資訊系統檢索需求﹐二是分散式系統檢索需求。以下即分別說明之:

1. 單一資訊系統查尋檢索之需求:

(1) Cutter認為圖書館目錄應滿足之需求:1

Charles Cutter是分類編目學裡非常重要的人物﹐後代的資訊組織原理受之影響甚深﹐尤其是他在1904年所提出之目錄欲達到的三個目標:

讓使用者能自已知的作者﹑題名﹑主題找尋某一本書可顯示圖書館有關某一作者﹑某主題或某類文獻之館藏

可讓使用者根據版本﹑特徵等選擇某書

(2) IFLA認為讀者之書目資訊需求:

1995年﹐IFLA進行了一項有關書目基本功能的分析計畫﹐其中認為使用者對書目之需求有:2

a. 自檔案或資料庫中找到與他()所用之檢索條件相符的資料;

( find之需求)

b. 對於具有相同特性之資料,可辨識其間之差異;

( identify之需求)

c. 可根據內容、外形等條件,選擇適合其所需之資料;

( select之需求)

d. 可取得該資料。

(acquire or obtain 之需求)

檇禮 (Marilyn Drewry)等人認為使用者在檢索資訊系統時﹐主要之

需求為:3

我需要那些資料? (which)

此物件包含些什麼? (what)

誰製造這些資料? (who)

這些資料在何時何地蒐集 ? (when and where)

如何使用這些資料? (how)

(4) 菈文 (Ralph LeVan) 將資訊查尋哲學(searching philosophy)

為最小主義(minimalism)﹑最大主義(maximalism)﹑結構主義(structuralism)三種層次 :4

最小主義: 所謂最小主義是假設使用者沒有非常特定的檢索點﹐如他們不會分辨個人名稱與團體名稱﹐而只知以名稱(name)

索﹐所以資料庫提供者只需提供最少的檢索點供使用者檢索即可。由於所提供的檢索點最精簡﹐所以也是最必需的部份﹐通

常是不同系統間互通檢索(interoperability)所必備的項目。

最大主義: 所謂最大主義是假設使用者除了一般的檢索點外﹐還

需用到特定檢索點﹐以便找到更精確的資訊﹐所以資料庫提

供者需提供較多的檢索點供使用者檢索。

結構主義: 結構主義則是為了更精確的檢索而提供結構性記錄

﹐這類系統﹐為了精確查尋﹐比最大主義更為犧牲互通性。

菈文提出此三種查尋哲學之目的﹐主要是為說明Dublin Core描述之基

本項目雖少﹐但其架構可依不同層次之需求而做擴充﹐並配合

Z39.50﹐提供互通性的查尋功能。

2. 分散式資料庫查尋檢索之需求:

以目前資料庫蓬勃發展的趨勢而言﹐使用者之資訊來源不會只限於某一資料庫﹐如果方便的話﹐他一定願意用到較多的資訊源。所以多個資料庫查尋(multi-databases searching)是使用者共同的意願。這是Internet環境的最大特徵﹐也是目前任何資訊系統設計時必需提供的功能。美國康乃爾大學圖書館曾就多資料庫查尋之問題調查其讀者之需求﹐以深度訪談的方式訪問27位教授﹑60位大學生及研究生之意見﹐調查中發現﹐絕大多數的師生都認為圖書館應發展共通的檢索介面讓他們可同時查尋多資料庫

5

3. 資訊分享﹑館際合作之需求

圖書館所要處理的資料少部份是獨有的資訊﹐而絕大多數則會與其他單位之收藏重複﹐所以需要以整體的力量來整理資訊﹐將個別的人力﹑物力降到最低﹐為滿足此資訊需求﹐對於資訊組織標準會有較嚴格的規定﹐以求品質與一致性﹐這是圖書館環境中較為獨特之處。所以圖書館界會制定編目規則、分類表、標題表、機讀格式等,並力求遵守,即為滿足此一需求。

資訊流通之需求

圖書館資訊組織除了查尋與檢索外﹐尚需滿足流通之需求﹐這是一般的線上資訊系統不必考慮的部份。作品中的每一個物件均須給予登錄號、索書號即為滿足此一需求。

開架瀏覽之需求

圖書館的目錄不只為線上檢索之需﹐其資訊組織還需能滿足圖書館內部之資料開架瀏覽的需求﹐開架瀏覽需有井然有序的機制﹑又兼顧知識由一般到專門的展開﹑資訊同類相聚之需求。分類號及作者號的給予即為滿

足此一需求。

6. 典藏保存之需求

圖書館多數資訊是以實體保存﹐未電子化﹐也不打算丟棄﹐因此其資訊組織模式需考慮典藏保存之需求。因為長久保存之故,所以圖書館對其每一件館藏,幾乎都會建立目錄資料,若原件有註銷、遺失、遷移等情況,目錄中亦會載明。

() 圖書館目錄所掌握的文獻特性

圖書館是提供各類型資料的場所,它所收集的資訊相當多元化,其讀者群也涵蓋各階層、各領域,其目錄之功能主要是為滿足使用者資訊查尋與檢索需求﹐但也需考慮到資訊的分享﹑流通﹑典藏等功能﹐因此它所採用的資訊組織模式,必需符合各類資料之特性,但又不能太專指,以免失去一致性。根據IFLA在1996年所做之研究,將圖書館所要處理的資訊特性分為三類:【6】

a. 第一類是在書目記錄中所稱的智慧產物或藝術創作,所要描述的屬性包括:作品(works)、呈現方式(expressions)、媒體表現方式(manifestations)、單件(items)。

b. 第二類是對智慧產物或藝術創作負責的人或團體,所要描述的屬性包括:個人(persons)、團體(corporate bodies)。

c. 第三類是智慧產物或藝術創作之主題,所要描述的屬性包括:概念(concepts)、物(objects)、事(events)、地(places)

上述這些特性彼此有關連,第二類及第三類特性較易了解,如讀者可能會找某人之作品或有關某人之作品,而他所用來檢索的人名,可能和作品中所用者不同;也有可能找有關某物之作品,而所用的檢索名詞與系統所記載者不同。這都說明,這類資訊屬性描述之必要,以及必需建立與個人、團體名、概念名、物、事、地名等之權威記錄,否則無法滿足使用者之需求。至於第一類屬性則在說明資料與資料間之關係,在編目規則中主要表現在題名、叢書名等的描述上。所謂的作品是一個抽象名詞,我們對於一個作品的了解其實是透過它所有的呈現方式(expressions)而認識的,如當我們提到荷馬伊里亞德這個作品時,我們不是在談它的文字、或某一段詩文,而是指該作品所有的呈現方式。如一書可能有修訂或新增本、節縮或擴充本、翻譯或原文,這都是相同作品的不同呈現方式。當作品有大幅度的改寫、重寫、變奏時,則視為一新作品。藉由對作品的界定,我們可以將作品不同的呈現方式關連起來。而所謂的媒體表現方式(manifestation)則是作品之呈現方式的具體化,如該作品可能記錄在手稿、期刊、地圖、海報、地圖等媒體上。一個作品可能有幾種不同的呈現方式,而一種呈現方式可能以多種媒體記載,和呈現方式有關的屬性是作者,而和媒體表現方式有關的尚有出版者、製作者、經銷者等屬性。當外在形式、媒體或外在載體改變時,均視為一新媒體。最後需解釋的是單件(item),單件是具體的實物,如單冊書的複本、單捲錄音帶。同一媒體中的不同單件﹐狀況可能不同,如同一套書中﹐某單件可能已破損、或重新裝訂等。若再深入分析,有關作品(work)之屬性有:作品之名稱、體裁(如小說、戲劇、詩、奏鳴曲、變奏曲、繪圖...)、年代、其他獨特特性、使用對象、背景、演奏媒體、編號、調性、經緯度等等。

有關呈現方式之屬性有:

題名、體裁、年代、語言、其他獨特特性、深度、摘要、背景、評論、使用限制、樂譜類型、演奏媒體、比例尺、投影法、表現的技巧、紀錄技術、地圖影像屬性、遠端感應影像技術等。

有關媒體表現方式之屬性包括:

題名、作者敘述、版本、出版地、出版者、出版年、製造者、叢書敘述、載體型式、載體大小、媒體、錄音模式、來源、存取限制、字體、編號...。

和單件相關的屬性有

物件識別號、出處、標籤、展示史、物件外表狀況、處理相關資料、處理的時間、存取限制。

和人相關的屬性有:

個人之姓名﹑個人之生卒年﹑個人之頭銜﹑及其他相關之稱呼。

和團體相關的屬性有:

團體名稱﹑其他相關之稱呼﹑會議之屆次﹑會議之地點﹑會議之時間。

和概念相關之屬性有:

概念詞。

和物相關之屬性有:

物名。

和事件相關之屬性有:

事件名稱。

和地區相關之屬性有:

地區名稱

上述這些文獻特性之關係可以下圖表示之:7

就實務工作而言﹐為滿足上述之資訊需求及文獻特性﹐圖書館將書目資訊分為:題名及著者﹑版本﹑特殊資料細節(因有不同之媒體)﹑出版項﹑稽核項   叢書項﹑附註﹑標準號碼﹑標題﹑索書號﹑登錄號(條碼)﹑URL等﹐其中﹐有關著者﹑題名﹑主題等之描述﹐可滿足單一資料庫查尋之需求﹐有關版本﹑稽核項﹑出版項等之敘述可滿足資訊辨認之需求﹐索書號﹑條碼﹑URL等可滿足流通之需求﹐分類號可滿足開架瀏覽之需求﹐並設計ISO 2709及機讀格式以滿足資訊分享之需求﹐利用Z39.50通訊協定﹐以滿足分散式查尋之需求。而同一作品的所有出版品(即所有的呈現方式﹑媒體表現方式)亦可藉由劃一題名聚集在一起。

 

三、圖書館資訊組織模式之問題

由上述分析,我們發現IFLA所分析的資訊特性﹐正是編目規則所欲掌握的資訊屬性。而這樣的屬性描述﹐以圖書館所欲滿足的讀者需求而言﹐也恰到好處。此外﹐它在使用上也相當有彈性﹐正如菈文所言﹐可以只使用必備欄以滿足最小主義者之需求﹐也可詳細描述資訊以滿足最大主義者之需求﹐而其各項屬性也相當結構化﹐可分成如上所言的三大類﹐每一類下又分為幾小類﹐每類下各有其屬性。不過﹐若要挑剔起來﹐這樣的屬性描述並非毫無缺點﹐整個書目機制的問題可分為下列五方面來說:

在編目規則方面

無法滿足特殊資訊之需求: 如以地理資訊而言﹐編目規則對於

一張地圖的經緯度描述是四個頂點﹐而無法如FGDC所要的描述地圖裡面重要點的經緯度﹐或一張大圖裡面還可分成很多小區塊。

為求一致性﹐嚴格要求著錄來源﹐使得人員的訓練流於刻板。

對於出版品的認定較為傳統﹐較難適用於網路環境。

在機讀格式方面

部份定長欄﹑變長欄資料重複著錄﹐浪費時間。

採用ISO 2709的交換結構﹐適用在圖書館界﹐但不適用於和外界的資料交換。

在檢索系統方面

多數的檢索系統未能完全發揮機讀格式之資料特性﹐使得部份的

資訊描述流於浪費。

2. 多數的檢索系統所用之技術太過傳統﹐未能提供更智慧型的的檢索功能。事實上一個欄位化的資料庫也可作全文檢索﹐但多數的圖書館資訊系統未利用到全文檢索技術。

在支援檔方面

雖然圖書館界對於資訊屬性已有深入的掌握﹐但在此架構中應扮演重要角色的支援檔(也就是我們所熟稱的權威檔)﹐尚未被完全建立起來﹐如個人名稱﹑團體名稱﹑作品名稱﹑標題名稱﹑事件名稱﹑地理名稱權威檔等﹐這是使資訊結構化﹑系統化的重要利器。

() 在建檔機制方面

人工化的建檔模式無法應付爆炸的資訊量﹐及日益殷切的全文﹑多媒體資料庫建檔之需求﹐我們需要尋求更好的合作機制﹑自動化機制來建檔。

整體而言﹐圖書館的資訊組織模式因有其所要滿足的資訊需求及所要掌握的資訊環境﹑文獻特性﹐且目前所用的模式已標準化﹐所以我們可大膽預估﹐在二十一世紀圖書館界仍不可能放棄機讀格式﹐不過會針對上述缺點不斷改進。同時也會繼續發展與其他資訊組織模式相容之架構﹐以便提供更好的使用者共通檢索介面供分散式環境的多資料庫檢索。

四﹑跨資訊組織模式時代的來臨

誠如菈文所言﹐資訊檢索有最小主義﹑最大主義﹑結構主義三種﹐我們若以此標準來檢測圖書館界的資訊組織模式﹐筆者認為它要滿足最小需求並非難事﹐所以若要以MARC整理網路資源並無問題﹐困難的是如何以人力或軟體快速的整理網路資源﹐以及如何提供教佳的瀏覽與檢索介面﹔而若要以MARC整理特殊主題資訊﹐如各種電子圖書館欲建立之特殊資料庫﹐亦無不可﹐反而可省下重新開發系統的麻煩﹐但要完全滿足這類資訊檢索之特殊需求﹐則MARC較不適用﹐所以各種電子圖書館為特殊資訊而設計的metadata﹐實有其存在的必然性。而圖書館對於眾多的資訊組織模式應採何種態度呢?如果圖書館要設計具有特殊功能的地理資訊系統﹐或許它該考慮使用FGDC metadata﹐如果圖書館又兼具博物館的功能﹐或許它也該考慮使用CIMI metadata﹔否則﹐使用已被普及使用的MARC來整理地理資料﹑博物館的文物﹑圖片等﹐應是較明智的選擇。

雖然圖書館的資訊系統不是為滿足某種特殊主題或特定資料而設計﹐但圖書館的資訊檢索﹐因其使用者多資料庫查尋之需求﹐早已從單館系統邁入多館系統查尋的時代﹔因館藏及檢索的多元﹐也由單一資訊組織模式邁入跨組織模式之環境﹐這樣的服務架構可以下圖表示之:8

 

 

由上圖可知﹐圖書館之資訊源可能有印刷品﹑電子全文﹑多媒體﹑網路資源﹐其提供者可能有傳統圖書館﹑電子圖書館﹑商業性資料庫﹑網際網路﹑政府單位等等﹐這些資訊源可能都以不同的資訊組織模式儲存﹐所提供的檢索介面亦不相同。面對如此多元的資訊源﹐讀者的檢索負擔越來越沉重﹐如果我們仍像過去企圖教使用者各個資料庫的使用方法﹐其結果將是事倍功半﹐徒勞無功﹐所以設計一個跨系統﹑共通的使用者介面﹐如Z39.50﹐已成為重要的課題。舉例而言美國俄亥俄州的SOLINET系統即希望提供一個可整合檢索GILSEADMARCIntercat資料庫的工具﹐讓其民眾對於不同組織模式﹑檢索介面不再困惑﹐其架構如下圖所示。【9

 

要設計跨模式的共通檢索介面﹐做法有很多種﹐筆者已於「分散式資訊檢索協定在電子圖書館系統應用之探討」一文中詳述【10】﹐此處不再重複。以上述SOLINET系統之模式為例﹐其背後乃以一個能滿足最小主義的資訊查尋需求之屬性集﹐做為跨系統的基礎 (crosswalk)﹐目前這個基本的屬性集可能是Dublin Core。此模式之作法並非在一個系統上設計好幾種資訊組織模式﹐而是設計能跨越各種metadata的檢索介面。

 

結論

面對各種不斷出現的 metadata﹐我們認為圖書館界所使用的資訊組織模式將會繼續在二十一世紀普遍使用。因為它能滿足使用者之資訊需求﹐也掌握了各型資訊的特性。不過﹐在編目規則﹑機讀格式﹑檢索系統﹑支援檔的建立﹑及建檔機制方面﹐尚有諸多缺失及不足之處﹐急需改進﹐此外﹐為提供更完整的資訊服務﹐為使圖書館之資訊系統能跨不同組織模式查尋﹑交換﹐則需加強下列工作:

1. 儘速合作建立各種權威檔﹐以支援欄位化資料庫及全文資料庫的檢索。

2. 儘速建立合作整理﹑維護網路資源的機制﹐但不一定要用MARC組織。

積極研究各種 metadata﹐及其在各種電子圖書館的應用情況﹐並發展跨模式檢索之機制。除了ISO 2709外﹐應發展SGML與 MARC之轉換程式﹐以便未來能與其他組織模式交換資料。.

 

註釋

Charles A. Cutter, Rules for a Dictionary Catalog. 4th ed. U.S.

Bureau of Education Special Report on Public Libraries. Part

II, no. 340. Washington, D. C.: Govt. Print. Off.

2. ?Study on the Functional Requirements for Bibliographic

Records,?<http://www.nlc-bnc.ca/ifla/VII/s13/frbr/frbr.htm>

Marilyn Drewry, Helen Conover and Susan McCoy, ?Metadata :

Quality vs. Quantity,?lt;http://computer.org/conference/>

proceed/meta97/papers/hconover/mdrewry.html

Ralph LeVan, ?Dublin Core and Z39.50,?<http://cypress.dev.oclc.org/~rrl/docs/dublincoreandz3950-v1.1.html>

Sandra D. Payette and Oya Y. Rieger, ?Z39.50 : The User

Perspective,?<http://www.dlib.org/dlib/april97/cornet/

04payette.html>

同註2

同前註。

Carmel Maguire, etadata in Australia,?U> Bulletin of the American

Society for Information Science (October/November 1997):19.

Eric J. Miller and Tod Matola, ?The Monticello Project: Design

Considerations for a Virtual Library,?<http://www.oclc.org/oclc/

research/publications/review96/mon.htm>

陳昭珍﹐?「分散式資訊檢索協定在電子圖書館系統應用之探討」﹐第一界海峽兩岸科技資訊研討會:海峽兩岸網際網路資源應用(台北市:中華民國科技館際合作協會,民87),頁101