二、接續詞彙來源之演變分析

(一)接續詞彙來源之數量分析

所謂接續詞彙乃是指某一個詞彙之下一個檢索詞彙,其與前一個詞彙存在著次序上的關係。此外,由於每次檢索之最後一個字並無所謂之下一個詞彙,故本研究所得之411個檢索詞彙必須扣除各次檢索之最後一個詞彙,因而接續詞彙來源便僅剩371個(即411-40=371)。而此40個尾字在資料處理時均被視為無效值(missing value)。

從表4可看出,各接續詞彙所使用的來源仍以檢索互動來源為主,有效百分比為56.3%。比例次之的是書面問題陳述來源,共計出現82字,有效百分比為22.1%。而接續詞彙來源中字數最少的是瀏覽檢出文獻來源,僅有17個,有效百分比為4.6%。整體而言,詞彙來源最多的檢索互動來源,其接續詞彙來源也同樣最多,顯示檢索者較常使用檢索互動來源詞彙,同時不管該詞彙來源是什麼,其接續詞彙較常來自檢索互動來源。此外,書面問題陳述來源為首字的機會大於其他來源之詞彙;因為各次檢索之首字必然不會成為其他詞彙之接續詞彙,因此計算接續詞彙之數量時便驟少許多。相反地,瀏覽檢出文獻來源原有17個,而為其他詞彙之接續詞彙時仍維持17個,顯示瀏覽檢出文獻來源之詞彙並未發生於檢索首字與尾字(因為尾字為無效值,不被列入分析)。

4 接續詞彙來源之數量分析表

接續詞彙來源

字數

百分比

累計百分比

書面問題陳述來源

82

22.1

22.1

檢索互動來源

209

56.3

78.4

研究者提供之詞彙來源

32

8.6

87.1

瀏覽檢出文獻來源

17

4.6

91.6

系統索引檔來源

31

8.4

100.0

總計

371

100.0

100.0

(二)接續詞彙來源之比例分析

5為各種接續詞彙來源之比例分析,各接續來源已按照比例高低排序。首先,表中顯示連續使用同一來源之比例偏高,但比例上卻有差別,如檢索互動來源之後繼續選用檢索互動來源之比例達65.2%,而系統索引檔來源更高達75.8%。其餘相同來源之演變(即書面問題陳述來源→書面問題陳述來源,研究者提供之詞彙來源→研究者提供之詞彙來源),亦出現次高比例值。惟瀏覽檢出文獻來源→瀏覽檢出文獻來源的比例偏低,僅12.5%,顯示詞彙來源為瀏覽檢出文獻來源時,其下個詞彙來源又是瀏覽檢出文獻來源的比例遠低於其餘四種相同來源被接續使用之比例。

5亦顯示,各接續來源比例最高的是系統索引檔來源→系統索引檔來源,約佔七成六,即連續使用系統索引檔來源詞彙的機會比連續使用其餘四種相同來源之機會更高。除相同來源之演變外,表中亦可看出,扣除系統索引檔來源→系統索引檔來源後,其餘四種接續詞彙之來源均以檢索互動來源之比例最高,顯示檢索者使用一詞彙後傾向選用檢索互動來源詞彙。其次,前後詞彙使用相同來源之比例高低依序是系統索引檔來源、檢索互動來源、書面問題陳述來源、研究者提供之詞彙來源、與瀏覽檢出文獻來源,而Spink之研究結果發現前三者之順序為書面問題陳述來源、系統索引典(類似本研究之系統索引檔來源)、檢索互動來源,(註39)雖與本研究所得之來源順序有些微差異,但基本上卻是三個相似之詞彙來源,顯示書面問題陳述來源,檢索互動來源,和系統索引檔來源已是接續詞彙之主要來源。

5 接續詞彙來源之比例分析表

詞彙來源

接續詞彙來源

字數

百分比

書面問題陳述來源

檢索互動來源

58

51.8

書面問題陳述來源

44

39.3

研究者提供之來源

6

5.4

瀏覽檢出文獻來源

3

2.7

系統索引檔來源

1

0.9

檢索互動來源

檢索互動來源

120

65.2

書面問題陳述來源

31

16.8

研究者提供之來源

17

9.2

瀏覽檢出文獻來源

11

6.0

系統索引檔來源

5

2.7

研究者提供之來源

檢索互動來源

15

57.7

研究者提供之來源

8

30.8

書面問題陳述來源

2

7.7

瀏覽檢出文獻來源

1

3.8

系統索引檔來源

0

0

瀏覽檢出文獻來源

檢索互動來源

11

68.8

書面問題陳述來源

3

18.8

瀏覽檢出文獻來源

2

12.5

研究者提供之來源

0

0

系統索引檔來源

0

0

系統索引檔來源

系統索引檔來源

25

75.8

檢索互動來源

5

15.2

書面問題陳述來源

2

6.1

研究者提供之來源

1

3

瀏覽檢出文獻來源

0

0

(三)檢索詞彙來源與接續詞彙來源之演變關係

6顯示詞彙來源與接續詞彙來源之矩陣次數關係。本研究嘗試利用對數—線性模式(log-linear model)中的獨立模式(independence model)和準獨立模式(quasi-independence model),以分析檢索詞彙來源的演變。

由於詞彙來源分為五類,故詞彙來源與接續詞彙來源之演變關係便形成一個5×5之矩陣表格。表中將各詞彙來源以簡稱標示,即書面問題陳述,檢索互動,研究者提供,瀏覽檢出文獻,與系統索引檔。各細格(cells)中由上而下呈現四個數字,最上面的值為實際觀察值,也就是各接續來源出現的字數,細格中第二個數值為期望字數,也就是理論上應該出現的字數,其算法如下所示:(註40

簡化即為

細格中第三個數值稱為餘數(residuals)或殘差,為觀察值與期望值之差(即第一個數字減去第二個數字的差)。最後一個數值,也就是第四個數字稱為標準殘差(standardize residuals),其算法為將殘差值除以所有觀察值之標準誤(standard error)。(註41)例如,行列之第一個細格顯示使用書面問題陳述來源後接著使用書面問題陳述來源的詞彙數有44個,而其期望字數為(112×82)/37124.8,故殘差值為4424.819.2,而該細格之標準殘差則為3.9

一般而言,標準殘差值若介於合理機率值1.96之間,則表示表中行、列兩自變數之關係是隨機的(random),也是獨立的(independent)。反之,若標準殘差大於1.96或小於 -1.96,則表示此二自變數之間並非各自獨立,而是相互影響的。更進一步地說,當標準殘差值大於1.96時,表示兩自變數間具有正向關係,也就是促長關係(facilitating relation);反之,其值若小於-1.96,則顯示兩自變數將產生負向關係或稱非促長關係(non-facilitating ralation)。(註42

6 詞彙來源與接續詞彙來源之演變分析表

時間

時間

(T+1)

(T)

書面問題陳述

檢索互動

研究者提供

瀏覽檢出文獻

系統索引檔

總計

44

58

6

3

1

書面問題

24.8

63.1

9.7

5.1

9.4

112

陳述

19.2

-5.1

-3.7

-2.1

-8.4

3.9

-.6

-1.2

-.9

-2.7

31

120

17

11

5

檢索互動

40.7

103.7

15.9

8.4

15.4

184

-9.7

16.3

1.1

2.6

-10.4

-1.5

1.6

.3

.9

-2.6

2

15

8

1

0

研究者

5.7

14.6

2.2

1.2

2.2

26

提供

-3.7

.4

5.8

-.2

-2.2

-1.6

.1

3.8

-.2

-1.5

3

11

0

2

0

瀏覽

3.5

9.0

1.4

.7

1.3

16

檢出文獻

-.5

2.0

-1.4

1.3

-1.3

-.3

.7

-1.2

1.5

-1.2

2

5

1

0

25

系統

7.3

18.6

2.8

1.5

2.8

33

索引檔

-5.3

-13.6

-1.8

-1.5

22.2

-2.0

-3.2

-1.1

-1.2

13.4

總計

82

209

32

17

31

371

6之皮爾森卡方值(Pearson chi-square)為258.618,可能性卡方比(likelihood ratio chi-square)為156.437,自由度df=16,上述兩項之發生機率均小於.001,達統計上之顯著水準,故拒絕行、列兩自變數獨立存在的假設。因此,檢索者選擇某一詞彙來源到下個詞彙來源之選擇並非隨機的,或可說時間T時之詞彙來源會影響時間T+1時之詞彙來源。換言之,一詞彙來源將明顯地具有某種程度之預測力,且能影響下一個詞彙來源之選擇,此研究結果與Spink之發現不謀而合。(註43

6呈現25對詞彙來源與接續來源之組合配對,其中七組呈現顯著關係,在這七組中有三組大於1.96,四組小於-1.96,即28%之配對組合呈現顯著之相依關係。進一步地說,標準殘差值大於1.96之配對發生於書面問題陳述來源→書面問題陳述來源,研究者提供之詞彙來源→研究者提供之詞彙來源,系統索引檔來源→系統索引檔來源,顯示來源原是書面問題陳述來源、研究者提供之詞彙來源和系統索引檔來源之詞彙,其接續詞彙之來源仍以出現相同之詞彙來源為主;此外,即使檢索互動來源→檢索互動來源,瀏覽檢出文獻來源→瀏覽檢出文獻來源之標準殘差值未大於1.96,但其值卻顯然大於其他各細格內之標準殘差值,因此,各詞彙來源並非隨機出現的,尤其是相同詞彙來源間的演變。

此外,表6亦顯示標準殘差值小於-1.96之細格有書面問題陳述來源→系統索引檔來源,檢索互動來源→系統索引檔來源,系統索引檔來源→書面問題陳述來源,系統索引檔來源→檢索互動來源,表示此四組中選用前項來源後較不可能接著使用後項詞彙來源。此結果與Spink之研究發現差異不大,均包括書面問題陳述來源→系統索引檔來源、系統索引檔來源→書面問題陳述來源兩組,至於檢索互動來源→系統索引檔來源及系統索引檔來源→檢索互動來源兩組之研究發現與Spink之研究結果不同,可能導因於取樣上的差異所產生的自然結果。(註44

(四)不同接續詞彙來源之演變關係

由上表6得知某一詞彙來源若為S,則其下一個詞彙來源也傾向使用S來源,也就是檢索者傾向選用同一詞彙來源。然而,是否可能因為此種連續選用同一詞彙來源之檢索行為,才使前後詞彙來源之演變呈現相依關係?因此,仍有必要進一步探討不同接續詞彙來源之選擇是否也出現相互影響的現象?事實上,表7與表6是類似表格,惟表7之前、後相同來源細格內之數值(即斜對角線細格值)均已化為0(稱為結構化歸零,structural zeros)而被刪除。(註45)意即處理表6之細格資料時,對於前後相同來源之詞彙均不加以分析,如此便可獲得表7,此方式稱為準獨立模式(quasi-independence model)(註46),而表6之分析方法則稱為獨立模式(independence model)。(註47

由於表6之詞彙總數已扣除各次檢索之尾字,故詞彙總數為371字,而表7又因扣除前後相同來源之詞彙數目,故僅剩172字(371-44-120-8-2-25=172)。至於細格內各數值之結構則同表6,也就是第一個數值是實際觀察值,第二個數值是理論期望值,第三個數值是觀察值與期望值之差,最後一個數值為標準化之殘差值。

7顯示,書面問題陳述來源→檢索互動來源,檢索互動來源→書面問題陳述來源,檢索互動來源→研究者提供之詞彙來源,檢索互動來源→瀏覽檢出文獻來源之標準殘差值大於1.96,顯示上述各組之前項詞彙來源,其接續之詞彙來源較可能是後項詞彙來源。另一個值得留意的現象是,表7中並未出現標準殘差值小於-1.96的情況,顯示不同來源間的演變關係只可能是隨機的或是促長關係。前項研究結果與Spink之研究結論相同,即各細格之標準殘差值均未出現小於-1.96,(註48)但本研究卻發現四組大於1.96之細格,即書面問題陳述來源→檢索互動來源、檢索互動來源→問題陳述來源、檢索互動來源→研究者提供之詞彙來源、與檢索互動來源→瀏覽檢出文獻來源等四組。此結果不僅代表這四組不同詞彙來源間之變化關係是促長關係,同時顯示檢索互動來源與其餘四種詞彙來源間的演變關係更為複雜多變。

7 不同詞彙來源之演變關係分析表

時間

時間

(T+1)

(T)

書面問題陳述

檢索互動

研究者提供

瀏覽檢出文獻

系統索引檔

總計

58

6

3

1

書面

35.2

9.5

5.9

2.4

68

問題陳述

22.8

-3.5

-2.9

-1.4

3.8

-1.1

-1.2

-.9

31

17

11

5

檢索互動

14.1

8.9

5.6

2.2

64

16.9

8.1

5.4

2.8

4.5

2.7

2.3

1.9

2

15

1

0

研究者

4.0

9.3

1.6

.6

18

提供

-2.0

5.7

-.6

-.6

-1.0

1.9

-.5

-.8

3

11

0

0

瀏覽

3.1

7.2

2.0

.5

14

文獻檢出

-.1

3.8

-2.0

-.5

-.1

1.4

-1.4

-.7

2

5

1

0

系統

1.8

4.1

1.1

.7

8

索引檔

.2

.9

-.1

-.7

.2

.4

-.1

-.8

總計

38

89

24

15

6

172

陸、結論

本研究係以國立台灣大學PsycLIT光碟資料庫為研究工具,藉以探討資訊需求者之檢索詞彙來源與檢索詞彙效益。本研究利用問卷法、觀察法與訪問法進行資料搜集,共計進行有效檢索40次,產生411個檢索詞彙。玆將研究之分析結果歸納如下:

一、檢索詞彙來源之分析

(一)檢索詞彙數量與檢索詞彙來源之基本分析

40次檢索中以使用59個檢索詞彙之檢索次數最多,約佔全部檢索次數之38%。平均每次檢索使用10.3個檢索詞彙。此結果與Saracevic所謂之「典型檢索」應含10個檢索詞彙之說法幾乎相同。(註49)此外,研究發現大量使用檢索詞彙之原因皆與提供於書面問題陳述之關鍵詞彙數量和運用系統之檢索功能有關,顯示有必要針對上述兩種檢索特性進行深入探討。

40次檢索中,以檢索互動來源曾出現之檢索次數最多,共計37次,而書面問題陳述來源次之,顯示檢索互動來源與書面問題陳述來源之詞彙為檢索過程中最常被選用之詞彙來源。同時,本研究將詞彙來源分為五種,並未發現任何一次檢索同時使用此五種詞彙來源。大致而言,接近半數檢索選用3種詞彙來源,平均每次檢索選用2.7種詞彙來源。

(二)檢索詞彙來源之數量分析

各種詞彙來源出現字數最多的是檢索互動來源,共有213字。書面問題陳述來源次之。此二種詞彙來源約佔全部檢索詞彙比例之80%,顯示本研究檢索者之檢索詞彙主要來自檢索互動與書面問題陳述兩來源。其次,瀏覽檢出文獻之詞彙數量最少,僅有17字,顯示檢索者並不常利用檢出之相關文獻協助其選擇檢索詞彙。整體說來,檢索者之檢索詞彙來源主要源自檢索者本身之學科知識,顯示檢索者可以自行決定80%之檢索詞彙,但另外20%之檢索詞彙則必須依賴資訊檢索系統(包括資料庫檢索系統、研究者)予以協助。

各次檢索中以使用2個書面問題陳述來源之檢索次數最多,平均每次檢索使用2.9個書面問題陳述來源之詞彙。其次,所有詞彙來源中以檢索互動來源之詞彙數量最多,共計213字,平均每次檢索使用5.3個檢索互動來源詞彙,由於此數較書面問題陳述來源之平均值高出許多,代表檢索者較傾向利用檢索互動來源選擇詞彙,其原因可能在於此類詞彙兼具檢索者之知識背景與資訊系統之協助,而使檢索者較常使用此類詞彙來源。

至於使用研究者提供之詞彙來源之檢索次數僅有18次,平均每次檢索使用0.8個研究者提供之檢索詞彙,顯示檢索者並不常採用研究者建議之詞彙。綜合言之,造成低使用率之原因可能來自研究者對主題內容較檢索者陌生,僅能提供檢索上之建議,卻無法深入瞭解其資訊需求。其次,瀏覽檢出文獻行為可說是檢索者最初的相關判斷,也是所有查詢幾乎必經的檢索過程。本研究共計出現17個瀏覽檢出文獻來源之詞彙,平均每次選用0.4個此類來源進行檢索。根據研究者之觀察發現,非本研究之檢索者所使用的瀏覽時間較研究對象長,此現象可能是因為本研究之檢索者知道自己受到觀察而刻意或無意地修正原有之瀏覽行為,而產生所謂之霍桑效應。(註50

至於系統索引檔來源方面,本研究共計產生33字系統索引檔來源詞彙,平均每次選用0.7個此類詞彙來源。其次,系統索引檔以字母順序呈現屬於自然語言之關鍵字,以提供檢索者選用檢索詞彙。因此,系統索引檔詞彙應是檢索者最熟悉的系統詞彙來源。當檢索者之資訊需求並不十分明確時,應可直接選用系統索引檔詞彙進行檢索,再由檢出文獻中找出適當之檢索詞彙。

(三)書面問題陳述之檢索詞彙數量對選擇檢索詞彙來源之影響

一般咸認為,檢索者提供於書面問題陳述之關鍵字愈多,其使用之檢索詞彙亦會隨之增加。本研究之分析結果除證實上述說法外,更發現檢索者提供之關鍵字愈多,其選擇檢索詞彙來源之行為便愈複雜。其次,檢索者所使用的檢索詞彙應是檢索前經過深思熟慮後所獲得之關鍵字,但本研究卻發現10次檢索出現未使用書面問題陳述來源詞彙之情況,佔總檢索次數之25%,而出現此現象之詞彙數則達19字之多,顯示檢索者之資訊需求狀況是隨時改變的,因此檢索中介者應留意此現象對檢索過程與檢索結果所引發的影響。

此外,研究亦發現書面問題陳述之關鍵字愈多,其檢索互動來源亦會相對增加。基本上,屬於檢索互動來源之詞彙乃是檢索者在查詢過程中與系統或研究者進行互動而自發聯想之詞彙,故此二來源同樣都是由檢索者產生檢索詞彙之來源。因此,當檢索者所提供之關鍵字愈多,其相對之互動來源詞彙便可能隨之增加。因此,檢索者提供之詞彙數目愈多,通常其對各來源詞彙的使用也會更為多元而複雜。

至於是否有可能未使用書面問題陳述所提供之檢索詞彙?一般而言,檢索中介者(或館員)進行檢索前,通常會先進行檢索晤談,此時,資訊需求者必須填寫檢索問題與可能使用之關鍵字,以利檢索中介者據以選用各種查詢策略。然而本研究卻發現,即使由資訊需求者自行檢索亦會出現未使用書面問題陳述來源中預先想好之關鍵字。

由於此現象出現的比例高達25%,表示每四次檢索便有一次出現不使用預先想好之詞彙,所以值得檢索中介者留意,因為檢索者的資訊需求可能是隨時變化的,如果檢索中介者僅根據資訊需求者所提供之詞彙進行查詢,而未進一步了解這些所謂之「關鍵字」與資訊需求間之關係,其檢索結果可能會與資訊需求者的需要產生極大的落差。

二、接續詞彙來源之演變分析

(一)接續詞彙來源之數量分析

本研究共計獲得371個接續詞彙,各種接續詞彙來源中以檢索互動來源之接續詞彙數量最多,共計209字,為全部接續詞彙之56%,其次為書面問題陳述來源。兩項接續詞彙來源之總數即佔全部檢索詞彙總數之78%,顯示檢索者傾向使用書面問題陳述來源與檢索互動來源。此外,由檢索詞彙來源與接續詞彙來源之關係得知,書面問題陳述來源較常為檢索之首字,而瀏覽檢出文獻來源之詞彙則從未發生於檢索之首字與尾字。由此可知,檢索者選用詞彙來源之行為應有一定的規律可尋,只是此種規律應有更多之實證研究證明其規則性。

(二)接續詞彙來源之比例分析

一般說來,檢索者使用某一詞彙來源之後會選用哪些詞彙來源?研究發現,連續使用同一種詞彙來源之比例偏高,其中又以系統索引檔來源與檢索互動來源最高;至於書面問題陳述來源與研究者提供之詞彙來源則次之。惟瀏覽檢出文獻來源→瀏覽檢出文獻來源的比例偏低,僅12.5%,顯示詞彙來源為瀏覽檢出文獻來源時,其下個詞彙來源又是瀏覽檢出文獻來源的比例遠低於其餘四種相同來源被接續使用之比例。若前後為不同詞彙來源之詞彙數量中除系統索引檔來源外,其餘四種接續詞彙之來源均以檢索互動來源之比例最高,顯示檢索者使用一詞彙來源後傾向選用檢索互動來源詞彙。

(三)檢索詞彙來源與接續詞彙來源之演變關係

研究分析結果顯示,檢索者由某一詞彙來源到下個詞彙來源之選擇並非隨機的,或可說時間T時之詞彙來源會影響時間T+1時之詞彙來源。進一步地說,如表8所示,原是書面問題陳述來源、研究者提供之詞彙來源和系統索引檔來源之詞彙,其接續詞彙之來源仍以出現相同之詞彙來源為主。但詞彙來源是書面問題陳述來源和檢索互動來源之詞彙,其下一個詞彙之來源較不可能是系統索引檔來源;是系統索引檔來源之詞彙,其接續詞彙之來源便較不可能是書面問題陳述來源和檢索互動來源。

8 詞彙來源與接續詞彙來源之演變關係摘要表

時間

時間

(T+1)

(T)

書面問題陳述

檢索互動

研究者提供

瀏覽檢出文獻

系統索引檔

書面問題

陳述

檢索互動

 

研究者

提供

瀏覽

檢出文獻

系統

索引檔

: 表示兩詞彙來源為促長關係

: 表示兩詞彙來源關係密切,但非促長關係

: 表示兩詞彙來源為非促長關係

(四)不同接續詞彙來源之演變關係

雖然由上述研究結果得知,某一詞彙來源若為S,則其下一個詞彙來源也傾向使用S來源。然而,有必要進一步探討不同接續詞彙來源之選擇是否也會相互影響。研究將前後相同來源之詞彙刪除,重新審視詞彙來源與接續詞彙來源之演變,結果如表9所示,使用書面問題陳述來源後較可能選用檢索互動來源,而檢索互動來源之後,其可能使用之來源依序是書面問題陳述來源,研究者提供之詞彙來源與瀏覽檢出文獻來源等。因此證明檢索詞彙來源的選擇是複雜多變的,但卻有其規則可循,尤其是檢索互動來源與其餘四種來源的變化關係。

9 不同詞彙來源之演變關係摘要表

時間

時間

(T+1)

(T)

書面問題陳述

檢索互動

研究者提供

瀏覽檢出文獻

系統索引檔

書面問題

×

陳述

檢索互動

×

研究者

提供

×

瀏覽

檢出文獻

×

系統

索引檔

×

: 表示兩詞彙來源為促長關係

×: 表示不列入處理之資料

綜合言之,一個理想的資訊檢索系統,它所具備的詞彙應該可以指出文獻與檢索問題中具有相同概念的事物,並透過詞彙間語意關係(如相關詞、狹義詞或廣義詞)的呈現,說明這些概念之間關係的遠近親疏。因此,詞彙不僅透露文獻及資料的內容,同時也表達、陳述檢索者的檢索問題,以使資訊系統順利地執行檢索與查詢。(註51)雖然各種超文(hypertext)系統不斷地研發改進,但在資訊系統與檢索技術尚未有革命性改變的今日,詞彙的使用仍是人與資訊檢索系統間互動的最主要媒介。

對於這項溝通媒介的了解,應以解析檢索者的行為為基礎,包括重視選擇詞彙之決策過程,並繼續檢索行為之調查,如各種檢索互動行為的實證調查,包括瀏覽行為、錯誤行為、停頓行為、選擇行為、及相關判斷行為等研究。同時並以認知觀點探討使用者之資訊尋求行為,包括分類概念的建立、記憶與學習形態、及語意因素的影響等。(註52)經由透徹地瞭解使用者行為,才能建構圖書館服務的整體藍圖。

當然,檢索中介者也必須加強本身選擇檢索詞彙的能力,並推廣控制詞彙觀念與索引典使用,因為控制詞彙可以解決自然語言之歧義(ambiguity)與含混(vagueness)兩大問題。其次,注重資訊檢索中有效之文獻表達(documentation representation)也是一項不可或缺的前置工作,因為文獻表達涉及作者、資訊處理者(人/機)與資訊需求者三者間對詞彙的選擇與運用。換言之,除了必須了解檢索者所使用的詞彙外,尚須具有語言學的基本知識,尤其是語言的使用與意義理論(meaning theory)的應用,(註53)這些知識都將有助於文獻分析者能完整而不失真地表達文獻所有的內容。

另一方面,由於電腦通訊技術的發達,使得網路成為學術研究者不可或缺的工具,再加上圖書館中各種人工檢索系統(如卡片目錄)大多已轉換成電子檢索的型態,如線上公用目錄、光碟網路資料庫、線上資料庫等,故而,資訊檢索者的檢索行為已與人工檢索時代不同。更因為資訊載體的發展而凸顯研究檢索者行為的重要性。這些隨著科技發展而改變使用者檢索行為的資訊媒體,使得資訊檢索行為的研究變得極其重要。首當其衝應了解的便是資訊需求者與檢索系統間的共通語言-檢索詞彙的研究。因此,在終端使用者逐日增多的趨勢下,了解檢索者選擇詞彙的決策過程應有助於改進資訊檢索介面的設計,並協助提供一個具有親和力(user-friendly)的中介檢索系統。

了解選擇檢索詞彙來源的決策行為是研究檢索互動的基礎,但不可諱言地,國外有關檢索詞彙選擇的實證研究極為缺乏。觀之國內的情況,對選擇檢索詞彙行為的相關研究幾乎是付之闕如,這種現象無異凸顯出進行檢索詞彙研究的重要性與迫切性。我們都希望有擁有一部極為傑出的資訊檢索系統,但我們更希望能多了解檢索者的資訊尋求行為,這些研究與調查是必要的,也是最基礎的工程。

【註 釋】

1:蔡明月,線上資訊檢索—理論與應用(台北市:台灣學生,民國80年),頁2

2Amanda Spink and Tefko Saracevic, “Dynamics of Search Term Selection during Mediated Online Searching,” In Proceedings of the 56th Annual Meeting of the American Society for Information Science Vol.30 (1993): 63.

3Cyril Cleverdon, “The Cranfield Tests on Index Language Devices,” Aslib Proceedings 19:6(1967):173-194.

4:同註2

5:同前註,頁63-64

6Nicholas J. Belkin and W. Bruce Croft, Retrieval Techniques, Annual Review of Information Science and Technology Vol.22 1987: 112.

7:同前註,頁129

8C. Pablo R. Dubious, Free Text vs. Controlled Vocabulary: A Reassessment, On-line Review 11:4August 1987: 243.

9Tefko Saracevic, Hartmut Mokros and Louise Su, Nature of Interaction Between Users and Intermediaries in Online Searching: A Qualitative Analysis, In Proceedings of the 53th Annual Meeting of the American Society for Information Science Vol. 27 (1990): 49-51.

10Tefko Saracevic and Paul Kantor, A Study of Information Seeking and Retrieving. III. Searchers, Searches, and Overlap, Journal of The American Society for Information Science 39:31988: 199.

11Stephen P. Harter, Online Information Retrieval: Concepts, Principles, and TechniquesOrlando, Florida: Academic Press, 1986., 150.

12Raya Fidel, Searchers' Selection of Search Keys: II. Controlled Vocabulary or Free-Text Searching, Journal of The American Society for Information Science 42:7 1991: 501-506.

13Raya Fidel, Towards Expert Systems for the Selection of Search Keys, Journal of The American Society for Information Science 35:4 1986: 42.

14Amanda Spink, Term Relevance Feedback and Mediated Database Searching: Implication for Information Retrieval Practice and System Design, Information Processing & Management 31:2 March/April 1995:169-170.

15Raya Fidel, The Selection of Search Keys, In Expert Systems in Libraries, edited by Rao Aluri and Donald E. Riggs ( Norwood, New Jersey: Ablex Publishing, 1990),156-159.

16Raya Fidel and Efthimis N. Efthimiadis, Terminological Knowledge Structure for Intermediary Expert Systems, Information Processing & Management 31:1 January/February 1995: 15-27.

17C. J. Van Rijsbergen, D. J. Harper, and M. F. Porter, The Selection of Good Search Terms, Information Processing & Management 17:2 1981: 77-91.

18S. E. Robertson and K. Sparck Jones, Relevance Weighting of Search Terms, Journal of The American Society for Information Science 27:3 May/June 1976: 129-146.

19:同註10,頁203-204

20Ruth Ann Palmquist and Bhaskaran Balakrishnan, Using a Continuous Word Association Test to Enhance a User's Description of an Information Need: A Quasi-Experimental Study, In Proceedings of the 51th Annual Meeting of The American Society for Information Science Vol.25 1988: 160-163.

21Reginald Ferber, Manfred Wettler, and Reinhard Rapp, An Associative Model of Word Selection in the Generation of Search Queries, Journal of The American Society for Information Science 46:9 October 1995: 685,697.

22Trudi Bellardo and Tefko Saracevic, Online Searching and Search Output : Relationships between Overlap, Relevance, Recall and Precision, In Proceedings of the 50th Annual Meeting of The American Society for Information Science. Vol.241987 : 11.

23Stephen P. Harter, Search Term Combinations and Retrieval Overlap: A Proposed Methodology and Case Study, Journal of The American Society for Information Science 41:2March 1990: 143-144.

24Mirja Iivonen, Consistency in The Selection of Search Concepts and Search Terms, Information Processing & Management 31:2March/April 1995: 180-185.

25Geraldene Walker and Joseph Janes, Online Retrieval: A Dialogue for Theory and PracticeEnglewood, Colorado : Libraries Unlimited, 1993, 115-116.

26:同註14,頁161-171

27Amanda Spink and Tefko Saracevic, Where Do Search Terms Come From? In Proceedings of the 13th National Online Meeting. Vol.131992: 363-373.

28:同註2

29Nicholas J. Belkin, P. G. Marchetti, and C. Cool, BRAQUE: Design of An Interface to Support User Interaction in Information Retrieval, Information Processing & Management 29:3May/June 1993: 325-344.

30David C. Blair, Language and Representation in Information RetrievalNew York: Elsevier Science Publishing Company, 1990, 18-19.

31:同註11,頁22

32:同註27,頁365-366

33:同註10

34Amanda Spink and Tefko Saracevic, Sources and Uses of Search Terminology in Mediated Online Searching, In Proceedings of the 55th Annual Meeting of the American Society for Information Science Vol.29October 1992: 251.

35:同註2,頁66

36:同前註,頁70

37:同註35

38:許士軍,管理學(台北市:東華,民國79年),頁42-45

39:同註2,頁72

40Marija J. Norusis, SPSS Advanced StatisticsTM 6.1. (Chicago : SPSS Inc. ,1994): 153-154.

41:同前註,頁207

42:同註2,頁67-68

43:同註2,頁67

44:同註2,頁68

45:同註40,頁189

46:同上註。

47:同註40,頁152

48:同註2,頁68

49:同註10

50:同註38

51Stephen P. Harter, Online Information Retrieval : Concepts, Principles, and Techniques (Orlando, Florida : Academic Press, 1986), 22.

52Elizabeth T. Hewins, Information Need and Use Studies, Annual Review of Information Science and Technology vol. 25 (1990): 164.

53:同註30,頁vii-viii