Yblog = yourblog,你的優質部落格。願真田幸村紅鎧策馬赤備突擊的身影,帶給我們更多的勇氣。
星期五, 十一月 9, 2007
從2007中時文學獎疑似抄襲事件淺談認清網頁庫存機制之必要
這2天anarch1001兄提到有關這次2007年中時文學獎新詩組的疑似文章抄襲事件,剛好前天睡前瞄到,就提供了一些比對和檢查文章的看法。

不過昨日經過評審討論,還是認定新詩獎得主磊兒的得獎資格取消,理由是與[發表時間]在2005年6月14日,由劉哲廷張貼在blogspot上的文章類似(當然不完全一樣)。

網路文章發表的時間爭議

我的看法是,通常碰到這類網路文章爭議,必須先釐清的是,一般部落格平台如果文章的修改時間可以變動,而文章的流水編號卻是不會變動的。比方說本文的網址是http://yblog.org/archive/index.php/7676,編號是7676,就算是把文章改成2005年發表,文章編號還是一樣,可以藉此辨別文章的正確發表時序

其次,如果文章發表的網站,看起來如果找不到文章編號的流水號,還可以看archive.org(網頁歷史庫存資料集合站)或Google搜尋引擎的cache葉面,會比較麻煩一點。至於其他的主要部落格平台(BSP),文章都有流水號,能夠協助求證相關文章的大概發表時間點。

一般的BSP讓使用者修改時並不會留下時間記錄,不像討論版修改會把時間顯示在前端頁面(個人強烈建議BSP也可以考慮加入這種機制,強迫顯示文章編輯的時間),BSP的資料庫其實也不會記錄,所以只能從google cache或archive.org的時光庫存網頁中比對,花時間且有效,但是否值得有待商榷。

如果與A文流水號接近的其他文章,其發表時間是某時,與B文流水號接近的其他文章發表時間遠遠晚於A文號碼附近文章的時間,就肯定B文較晚。當然不能肯定B文抄襲,但是B文的公信力就降低。

怎麼樣釐清文章原本內容?

既然修改文章並不會改變文章留水號,但是只要google 有索引,可以看庫存網頁,再來就是看archive.org時光網頁之前的文內容(要花時間找,且不一定有),和他現在的文章比便可得知。

archive.org的好處是保存不同時間不同網站[當下]的內容,但盲點是,並不夠全面,如果點選了時光網頁庫存頁面中該部落格的任何連結,網址變動下讓網址參數中的時間變成現在的時間,就表示這篇文章或使用者所點選的連結,已經沒有當時的版本,直接跳最新的給你。
這是我們在使用archive.org時必備的知識。


回過頭來看這次的中時文學獎事件:

劉哲廷兩年前的作品網頁(Dear Howard)

磊兒被取消首獎的作品網頁(是你正坐在我的位置看海的樣子)
(她自己的意思是2007年4月寫的,不過貼到網頁是10月了)

這次事件之所以被關注文章發表時間的問題,是因為劉哲廷先前曾經發生過這件文章抄襲他人的事情

而中時文學獎主辦單位取消磊兒首獎的得獎資格後,磊兒發表聲明要請律師走法律途徑,並希望有電信警察查證記錄,認為中時文學獎主辦單位判斷文章是否抄襲的方式不夠好。

我怎麼想的呢?

磊兒發表的文章在無名小站,無名小站在archive的資料很片面,幾乎不具參考價值。我們來看劉哲廷過去的庫存頁面資料,因為是放在google買下的重量級blog服務平台blogspot,所以一定會被索引進資料庫。很幸運地,我們可以在archive找到5份庫存網頁記錄,換言之就是5個時間點下,由archive.org從網路上下載庫存起來的當時首頁風貌。

我查詢的結果如下:

劉先生部落格最早在archive.org的庫存歷史頁面只有到2005年12月,而該篇文章為2005年6月14日所發表,所以我們就看2005年6月的文章列表,看有沒有這篇Dear Howard文章。

根據資料庫記載,2005年12月26日時的庫存網頁記錄,2005年6月14日該篇文章確實存在

可是,我犯了一個錯誤,所以昨天晚上回給anarch1001時沒注意到點選後的連結已經自動被轉換了。今天檢查本站優格網的歷史網頁資料時才發現自己的盲點,再仔細觀察,直接點選該連結的話,其實會被自動指定到新的日期連結去,也就是說archive.org當時該網頁的庫存紀錄只有部分而已,連結指定的頁面並沒有放到資料庫裡,所以只好抓新的資料來慨。這表示原先如果我們想閱讀2005年6月的文章列表,就幾乎已經沒辦法取得當時的資料。

透過流水號可判斷文章日期,但內容是否被修改無從判斷起

不過我們可以看文章的流水號,是118開頭的,2006年12月比較新的文章是168開頭,更後面的日期其流水號的數字就更大,所以證實這篇文章的流水號與日期應該沒錯。

那麼內容呢?由於前面提到,archive.org當時該網頁的庫存紀錄經過檢查只有部分而已,所以根本無從得知該篇文章是否在2005年6月14日就是我們現在看到的樣子,所以內容是否修改,實際上可相信與否?我只好持保留態度。

由於archive.org的資料庫運作維護是獨立第3方,可信度有一定的水準。要比對是否抄襲,最好的方式就是在這裡找到當時的庫存頁面。只判斷流水號是不行的,原因是就算流水號證實是某個時間發的,但是因為查不到那個時間的內容,所以也無法知道是否是後來才修改的內容,還是確實當初就是這份內容,也是一般檢查的盲點。

這次的事件,確實是滿麻煩的事情。

如果兩造作者的文章放在很小的網站,那麼結果可能又會不一樣。(我猜的)

所以到底誰才是真正的原作者?還是說這是個美麗的巧合?
老實說沒辦法給個肯定的答案。除非用更激烈的調查方式,包括看blogspot紀錄(幾乎不可能)、由第3方人員觀看劉先生電腦中硬碟的紀錄。

而原得獎者文章放在無名小站,最大的缺點就是無名小站沒辦法有完整的庫存歷史頁面資料,希望創作者能夠引以為戒,不要在無名小站寫文章,要是發生事情,也不容易找到庫存頁面來保護自己,這是本事件之後,個人最先想到的感想之一。orz

這引伸出另一個問題,就是我們該如何主張和保護自己的文章?

個人覺得最好的方式是透過archive.org索引庫存,但要讓這個網站能夠索引,最重要的就是文章放置的平台不能是類似無名小站這種太多人使用的平台,很難從archive.org找到自己的文章。

更甚者,要是像無名小站之前爆發用robots.txt(一種給搜尋引擎機器人索引資料用的文件檔案,負責抓取資料的機器人由此判讀能不能下載網站上的資料做索引)擋掉其他搜尋引擎機器人的事件,那麼你的部落格或網站,也沒辦法在archive.org或其他庫存網頁資料庫出現。

另一種方式就是定期拍照做備份,好像太過火了。XD

對於真正在剽竊或抄襲的敗類,我們應當抵制。
More... funp HemiDemi MyShare del.icio.us technorati Google Bookmarks Digg
ivan 發表於 7:34 PM | 文章分類: blog, 時事評論 | 標籤列表:

迴響留言
不喜歡 blog 模式的原因就在此
故此個人偏向於 論壇模式
甚至於 相近於 wiki 的模式
不過 wiki 有些過於麻煩 跟小複雜 <---- 可能個人不習慣吧
不過 如此模式 也代表 大量使用資料庫
或是 得 另行 製作模式 使 資料按文章 儲存於 該路徑之下 或是固定路徑之下

相對的 寫 blog 者 想必 會討厭 這些措施
因為能夠 自由 修改 文章內容 還有 日期 可算是 相當必要的功能 ?
(至於拿那些功能 做什麼用呢 ? ....)
而且 創作日期 修改日期 都被紀錄 令人感覺 被監視 ?
(不過個人 倒 挺喜歡的 畢竟 個人偏向於 系統 自行記錄 修改時間 歷史等)

(比如說 作業是 在 blog 上每隔一段時間寫一篇 針對某主題的 文章 )
(如果忘記 寫作業了 同時 學校是 每隔 一個半月 檢查一次 那麼 修改日期 就變的很重要)
(當年曾經用過 ..... XD)
(可是 換個角度嘛 保留 原文章創作日期 也有其功用 與必要性)

=====
定期拍照 很容易"製作"出來阿
只是 很少東西會需要 花費 精神 時間去製作罷了 (不值得)

這也是為什麼 法院最早並未接受 數位 格式的 證據
而 證據的 接受度範圍 總是 慢於新科技 一大步

數位的 有心 便能製作出來
唉 只能說 憑良心?
由 r 發表於 13:58, Nov 10, 2007
76.199.11.* | 標記為廣告 | 回應此篇迴響
名稱
電子郵件
網址




請輸入你在圖片中看到的文字
不然還有什麼其他比較好的網路文章書寫方式?XD
ivan 發表於 12:34, Nov 12, 2007
208.97.143.* | ivanusto at gmail dot com | 標記為廣告 | 回應此篇迴響
名稱
電子郵件
網址




請輸入你在圖片中看到的文字
well .. 如妳所說吧
由 類似 archive.org 等
或者是 有經過 第三方 律師 或是 相關等 驗證的 機制吧

不過 還是覺得 防不過 蓄意抄襲....
(創設一個 網站 或是用 某變種 blog ... 沒有被 任何一方 archive 的)
隨便亂寫日期 還不是一樣?

我覺得 文中主角 應該不是 證明自己是清白
而是該 反過來 告 劉某 抄襲

怎說....個人猜測啦
著作權這種東西 在於 誰先擁有 法律證據 或是 證明 該著作權
A 寫文 B 抄襲
B 先做存證信函 或是 找有執照的律師公證
那麼 該著作權 便歸 B 所有
除非 A 能夠 提有利證據

就像是 Creative拿 相似 的 檔案 架構 告 Apple

不管 主角 真的是清白 還是 假的清白
個人覺得 只有這樣做吧
由 r 發表於 2:59, Nov 18, 2007
76.199.14.* | 標記為廣告 | 回應此篇迴響
名稱
電子郵件
網址




請輸入你在圖片中看到的文字
定期將作品寄一份到yahoo及gmail,存在那裡.一方面可作為備份,另一方面可證明日該作品於某月某日完成.
由 無言 發表於 2:53, Nov 11, 2007
71.28.92.* | 標記為廣告 | 回應此篇迴響
名稱
電子郵件
網址




請輸入你在圖片中看到的文字
如果你有一千多篇文章,每一篇都要發到gmail,還是有點麻煩的。

另外,做為證明的記錄是否有效果,還有待保留。

不過倒是給創作者另一種機制。
ivan 發表於 12:36, Nov 12, 2007
208.97.143.* | ivanusto at gmail dot com | 標記為廣告 | 回應此篇迴響
名稱
電子郵件
網址




請輸入你在圖片中看到的文字
yep ...
gmail 收件日期 未必能在法律上有其效用
由 r 發表於 18:38, Nov 12, 2007
76.199.11.* | 標記為廣告 | 回應此篇迴響
名稱
電子郵件
網址




請輸入你在圖片中看到的文字
從黑米連過來的...
這件事情其實滿有趣的...
這其實曝露了人們對著作權法的誤解
著作權與其他的智慧財產權的最大不同
在於著作權不需要用登記來完成法律賦予「專用」的特權
只要「創作」完成,著作即被保護,
所以他不具有「獨占性」,
也就是說,著作人不能因為自己的著作與他人「雷同」,就斷定他人侵害本人的著作權,
因為我們不能證明人家是抄襲,誰知道世界上有沒有「相同靈感」這件事?
所以,僅能「懷疑」對方侵犯著作權...
所以,我們在處理著作權爭議問題時,
可以用下列文字來主張權利(請注意這樣的「告知」為必要要件):
敬啟者:
本人發覺您於 年 月 日發表於(媒體)之(創作名稱),與本人於 年 月 日發表於(媒體)之(創作名稱)雷同,
為避免誤會,請於文到 日內提供創作之紀錄以為憑據,
否則本人將以您侵犯本人著作權為由採取法律行動,為免訟累,切勿自誤,不便之處,亦請見諒。

另外「著作權」成立的前提要以公開發表為基礎,
因為著作如果不公開就沒有「抄襲」的機會。

再另外,創作紀錄還是以書面紙本為最佳,
個人還是不太信任電子紀錄,
如果有「價值」的著作,
最好還是以存證信函或法院或公證人之公證為宜。
由 藍色狂想曲 發表於 10:37, Nov 12, 2007
60.248.204.* | 標記為廣告 | 回應此篇迴響
名稱
電子郵件
網址




請輸入你在圖片中看到的文字
著作權本來就是著作人完成著作時即享有,問題是在網際網路時代,文章書寫多半放在網路上,以電磁記錄存在時,怎麼可能篇篇都法律公證記錄呢?

做得到的話,你倒是可以試試看從現在開始每一篇文章都公證好了。xd

事實上,正因為不可能,而且所有的文章都是有價值的,你寫一千篇文章,難保不會有一千篇文章都被人轉載盜走,甚至被人主張是他的作品,請問你又該如何呢?

正因為如此,網路上公信第三方的網頁庫存機制有其必要性,與不可取代性。

另外,還有一些輔助的機制可以幫忙庫存頁面,就是每篇文章產生獨一無二的key,且是加密產生過的。以及二維條碼形式,這些方式都是可以配合程式自動產生的。
ivan 發表於 12:42, Nov 12, 2007
208.97.143.* | ivanusto at gmail dot com | 標記為廣告 | 回應此篇迴響
名稱
電子郵件
網址




請輸入你在圖片中看到的文字
那些 key 在法律上 能有多少效力 還不知道
個人覺得是沒有效力的
因為那些 數字 只是存在於資料庫 而且 該資料庫 又未必有人背書 或是依照某特殊條例
進行 強制 保護 不得修改
又不像 檔案 有紀錄 檔案創作時間 修改時間 (即使是那個 也可以偽造...)

個人覺得 最主要是要等 法規 逐漸 進化
只能等吧
由 r 發表於 18:54, Nov 12, 2007
76.199.11.* | 標記為廣告 | 回應此篇迴響
名稱
電子郵件
網址




請輸入你在圖片中看到的文字
怎說
個人不確定台灣的 著作權如何
不過 至少 美國是如妳所說 創作出來 即擁有著作權
另外就是

即便妳擁有該著作權
沒有足夠的 錢財 雇用律師 承受法院步驟 甚至於 沒有足夠證據
即使著作權是妳的 也沒有用

(也就是說 要有辦法 去 執行 或是 強制執行 著作權)

基本上這跟 專利很像
妳有專利 但是沒有個 上百萬美金財力 去維護 等同於沒有

另外就是 存證信函 的確可以作為證據
但是 相對的 沒有能力/財力去維護 等同沒有

而且 這有些離題
因為 這次事件 主要問題在於 主角 創作
但是 卻被抄襲
即便 主角 創作之後 有找人公證
其文章 依然可以被人拿去 利用 並冠上 錯誤日期
總之 差別在於 拿文章去利用 冠上錯誤日期者
並沒有跳出來說 別人抄襲她 也沒有 提供任何證據 說是她所寫
又或者說 不是她所寫
總之 有點像是 一口咬死了 事件主角
(假設 該文章是 事件主角原創)
由 r 發表於 18:49, Nov 12, 2007
76.199.11.* | 標記為廣告 | 回應此篇迴響
名稱
電子郵件
網址




請輸入你在圖片中看到的文字
報告:

朱學恆寫了一篇逆轉證詞

http://blogs.myoops.org/lucifer.php/2007/11/14/objection
anarch 發表於 1:13, Nov 15, 2007
59.113.72.* | anarch1001 at gmail dot com | 標記為廣告 | 回應此篇迴響
名稱
電子郵件
網址




請輸入你在圖片中看到的文字
感謝提供資訊,已經回文一篇肯定。

再談2007中時文學獎疑似抄襲事件
ivan 發表於 2:20, Nov 15, 2007
208.97.143.* | ivanusto at gmail dot com | 標記為廣告 | 回應此篇迴響
名稱
電子郵件
網址




請輸入你在圖片中看到的文字
有個辦法不知有沒有公信力?
就是作者在部落格發表文章後,馬上在留言版留下全部或部分的文章內容存查.
因為留言版的時間好像沒有辦法去更改.
由 218.170.50.* 發表於 3:47, Sep 16, 2009
標記為廣告 | 回應此篇迴響
名稱
電子郵件
網址




請輸入你在圖片中看到的文字
抓下來也可能是做假的

最好還是有第三方的電磁紀錄公證
ivan 發表於 3:57, Sep 16, 2009
208.97.143.* | ivanusto at gmail dot com | 標記為廣告 | 回應此篇迴響
名稱
電子郵件
網址




請輸入你在圖片中看到的文字

張貼迴響:
名稱
電子郵件
網址



請輸入你在圖片中看到的文字
引用列表
本篇文章引用網址: http://yblog.org/api/trackback/?id=7676
沒有引用










Collablog Portal enabled