VitaBox AD

2013年7月14日 星期日

用文字呈現出一幅有意義的畫作_文字雲



這張圖是利用 Tagxedo(一個線上文字雲製作程式)製作出來的,文字來源是Learn & Share部落格,再搭配澳洲地圖作為文字雲的輪廓,相信大家對於這類型的圖案一定不陌生~~ (OS: 個人覺得這支程式的演算法應該還有改進的空間,原因等等會提~~)

文字雲是一種用文字組成的視覺化呈現方式,同時可將文字拼湊結果捏塑成各式圖案表示之,就如同天空中千變萬化的雲朵形狀。然而,若僅僅這樣,只能被稱之為藝術畫作而已。文字雲還有一個重要概念和意義,其透過字體的大小來呈現一個辭彙或單字在文字來源中出現的頻率,一個辭彙和單字在文字來源中出現次數越多,其字體越大。換句話說,其具有標註文章內關鍵詞彙的概念和功能,讓閱讀者一眼就大致了解文章內容並判斷是否要仔細閱讀內容。在這個資訊爆量的時代,這的確是一個快速篩選閱讀資料的好方法。(OS:或許可以用來減少誤入聳動標題的次數~~)

文字雲用字體大小來呈現關鍵字的概念很清楚,但實際運作起來可不容易,兩個目前想到的問題如下:

1.如何抓取和分辨不同語言文字的詞彙和單詞? 

就以中文和英文兩種語言來說,中文是一種以象形呈現的文字,所以其關鍵詞彙可以為一個字,例如:台灣2012年度代表字以"憂"居冠。但英文得是由一串字母組成才有意義的詞彙,同時可能還會遇到片語等等問題。(OS:我想說的是僅靠英文單字間的空格來作為篩條件,應該不是一個有效的方法~~)

2.如何分辨常用但無關鍵字意義的詞彙或單詞,例如"是"、"的"、" a "、" of "、" and "等等中英文常用但無關鍵字意義?

還記得剛剛說Tagxedo的演算法有改進的空間嗎? 原因是我認為澳洲地圖中間偏上方"的"文字過大,代表該程式可能有必要建立常用但無關鍵字意義的資料庫,同時修正演算法加以去除,文字雲的關鍵字意義才得以實現。


下列是兩個文字雲線上製作的網站,供大家參考。
1. Wordle
Note: 文字來源限制為英文字母
2. Tagxedo
Note: 文字來源可同時為中英文,但就如同上述說的,其演算法有改進的空間

沒有留言:

張貼留言