- 相關(guān)推薦
淺議醫院病歷檔案數字化若干問(wèn)題
[摘 要]本文根據作者多年在醫院信息化部門(mén)工作經(jīng)驗,對醫院病歷檔案數字化工作中涉及到的相關(guān)問(wèn)題進(jìn)行探討,主要涉及:數字化病歷檔案范圍的選擇、數據信息深度加工的內容、相關(guān)掃描參數的設定、圖像處理的要點(diǎn)、數字化加工組織形式的優(yōu)劣分析、OCR識別效果的比較、PDF病歷檔案的命名方法及其他數字化工作中應注意的問(wèn)題等。
[關(guān)鍵詞]病歷數字化;掃描;識別;管理
近年來(lái),隨著(zhù)各級醫院信息化建設的發(fā)展和移動(dòng)醫療等互聯(lián)網(wǎng)醫療方式的興起,醫院的病歷檔案數字化建設在不斷升溫。全國各級醫院的信息化部門(mén)都在積極推進(jìn)醫院歷史病歷檔案的數字化工作,但是各單位病歷檔案數字化工作過(guò)程中遇到一些具體問(wèn)題時(shí)往往做法有很大差別,筆者根據多年來(lái)在醫院信息化部門(mén)工作實(shí)踐工作中的一些經(jīng)驗,就病歷檔案數字化工作中的若干問(wèn)題的觀(guān)點(diǎn)闡述如下:
一、正確把握病歷檔案數字化的范圍和深度
提供利用是病歷檔案數字化核心價(jià)值的重要體現之一,利用的前提是病歷檔案的數字化,但是病歷檔案數字化不能簡(jiǎn)單的理解為掃描,不是所有的病歷組成材料都需要掃描,即病歷檔案信息的深度描述。圍繞如何全面、準確、深入地描述和加工檔案信息是檔案數字化最重要的原則。在開(kāi)展檔案數字化工作之前,應先對本單位的各科室病歷檔案分類(lèi)及利用情況做到詳細了解,在此基礎上開(kāi)展調研,從本單位的實(shí)際需求出發(fā),科學(xué)制定哪些分類(lèi)進(jìn)行數字化,哪些病歷檔案不進(jìn)行數字化,哪些病歷檔案進(jìn)行原文的掃描,哪些病歷檔案只進(jìn)行到信息條目的著(zhù)錄。
二、正確把握掃描圖像的相關(guān)參數
2.1圖像格式、分辨率的選擇
《檔案數字化技術(shù)規范》(DA/T31-2005)是各類(lèi)檔案數字化的參考標準,規定采用黑白二值、灰度、彩色幾種模式對檔案進(jìn)行掃描時(shí),其分辨率一般均選擇≥100dpi。如遇到文字偏小、密集、清晰度較差等特殊狀況,需要進(jìn)行OCR漢字識別的檔案,掃描分辨率可以選擇≥200dpi。而近年來(lái)實(shí)際工作中,因為醫生手寫(xiě)字跡清晰度的問(wèn)題很多單位在近年來(lái)病歷檔案數字化中均采用300dpi全彩掃描,圖像格式采用JEPG2000無(wú)損壓縮。
2.2圖像命名與存儲路徑
病歷檔案數字化的最初成果是以病歷檔案夾命名的圖像病歷檔案,應正確規定每一張圖片的命名,例如筆者曾經(jīng)在一次數字化中采用將總頁(yè)數放進(jìn)病歷檔案命名中的錯誤,如將一份18頁(yè)的病歷檔案的每一個(gè)圖片命名:1-18、2-18……目的為了提醒檢查環(huán)節注意不要缺頁(yè),但是這種命名會(huì )導致病歷檔案名稱(chēng)為10-18、11-18等頁(yè)在排序中出現錯誤,這樣在生成PDF病歷檔案的時(shí)候就會(huì )頁(yè)碼出錯。建議圖片的命名選擇六位字符(位數不宜過(guò)長(cháng)),如000001、000002以此類(lèi)推。另外,根據數字化的工作模式,一般應以病歷檔案的件號作為圖像存儲的最底層病歷檔案夾,且病歷檔案夾的命名位數要與檔案數據一致,比如病歷號為“15”,數據條目應“病歷號”應著(zhù)錄“015”,存儲病歷檔案的病歷檔案夾命名也應為“015”。
2.3掃描圖像的處理
掃描后的原始病歷圖像需要進(jìn)行優(yōu)化處理,使得成品圖像清晰、端正。圖像處理后保證圖像信息與原病歷檔案內容完全一致,不刪除頁(yè)面任何有用信息。根據檔案掃描后的具體情況,除常規處理外要特別進(jìn)行如下圖像處理:
(1)圖像歪斜:采用自動(dòng)或手動(dòng)糾偏功能,調整圖像角度。方向不正確的圖像應進(jìn)行旋轉還原,以符合閱讀習慣。
(2)圖像臟點(diǎn)、臟斑:對圖像頁(yè)面中出現的影響圖像質(zhì)量的雜質(zhì)如黑點(diǎn)、黑線(xiàn)、黑框、黑邊等應進(jìn)行去污處理。處理過(guò)程中應遵循保持檔案原貌的原則。
(3)字跡洇透:采用字跡銳化的功能,清晰字跡筆畫(huà)。
(4)圖像深淺不一:采用平衡功能,調整圖像深淺一致。
應注意以下兩個(gè)誤區:一是邊界的過(guò)分剪裁,有的單位在進(jìn)行數字化工作中對于病歷檔案頁(yè)碼剪裁的過(guò)多,或者采用批量剪裁的方式,這種情況會(huì )對有領(lǐng)導批示及其他重要信息的病歷檔案造成損失;二是部分單位對病歷檔案的底色的過(guò)分漂白,力求頁(yè)面美觀(guān),這種做法完全沒(méi)有必要,保持檔案病歷檔案的原始面貌是維護檔案真實(shí)、完整的重要內容。
三、病歷檔案數字化加工組織形式的優(yōu)劣比較
3.1沒(méi)有數字化加工系統,單兵作戰
有的數字化單位采用若干計算機組成局域網(wǎng),以病歷檔案共享的形式進(jìn)行數字化工作,不同的計算機分別進(jìn)行檔案條目信息著(zhù)錄、圖像掃描、圖像處理、批量掛接等環(huán)節,這種通過(guò)病歷檔案共享方式調取的形式容易出錯,不同的環(huán)節都有對數據的可操作性,容易修改或刪除圖像,影響正確率。
3.2采用數字化加工系統,系統作戰
隨著(zhù)檔案數字化工作的發(fā)展,專(zhuān)業(yè)性較強的單位為提高工作效率、加強質(zhì)量控制,一般都根據自身經(jīng)驗開(kāi)發(fā)了應用軟件,專(zhuān)門(mén)進(jìn)行檔案數字化流程控制的專(zhuān)業(yè)檔案數字化加工系統應運而生,將檔案數字化的全部工序納入系統管理中,環(huán)環(huán)相扣,將控制、檢驗納入數字化環(huán)節中,最終實(shí)現效率與質(zhì)量的同步提高。
筆者多次參與病歷檔案數字化加工管理工作,認為采用數字化加工系統進(jìn)行的病歷檔案數字化加工項目,效率明顯優(yōu)于沒(méi)有數字化加工系統的項目,更為重要的是在檔案數字化加工項目中效率和最終的準確率之間存在著(zhù)正比關(guān)系。
四、關(guān)于病歷檔案的OCR識別方式
病歷檔案數字化可以為全文檢索提供支持,重要的要應用支持是OCR技術(shù),大多數字化廠(chǎng)商選擇國內的漢王、文通的OCR程序進(jìn)行二次開(kāi)發(fā),通過(guò)API調用其程序完成識別。近年來(lái)使用俄羅斯ABBYY公司識別技術(shù)的單位越來(lái)越多,筆者對漢王和ABBYY兩者進(jìn)行對比,漢王識別的速度要快,但是準確率比ABBYY要低;ABBYY識別速度很慢,但準確率相對較高,建議數字化中使用ABBYY的識別技術(shù),其接口簡(jiǎn)單易用,可以選擇不同程度的設置來(lái)控制病歷檔案轉換的過(guò)程及結果。
【淺議醫院病歷檔案數字化若干問(wèn)題】相關(guān)文章:
數字化檔案03-21
關(guān)于“中國哲學(xué)”的若干問(wèn)題淺議03-18
淺議醫院人事檔案的電子信息化管理03-16
淺議醫院財務(wù)軟件特點(diǎn)及應用中若干問(wèn)題03-01
淺議如何提升醫院財務(wù)檔案管理的質(zhì)量03-16
淺議大學(xué)英語(yǔ)口語(yǔ)教學(xué)中的若干問(wèn)題及對策研究03-16
綜合性檔案館館藏檔案數字化鑒定探討03-20
對數字化檔案館的初步研究02-28