เนื่องจากช่วงนี้มีเรื่อง OpenData มาวนเวียน ซึ่งเรื่องพวกนี้ไม่ได้มีอะไรใหม่มากนัก หลายคนก็พยายามบอกว่ามันดีอย่างโน้นอย่างนี้ มีประโยชน์โน่นนี่ ถ้านักคอมพิวเตอร์หรือนักสถิติก็มักจะมอง Data ที่ว่านี้เป็น raw data ขนาดใหญ่ คนที่เป็นนักวิชาการก็อยากจะอยากได้ visualize data ออกมาเป็นกราฟปรับแต่งข้อมูลได้ ต่างคนต่างมีความต้องการต่างกัน ดังนั้นเราควรมามองย้อนกลับไปว่า OpenData อะไร? ทำไม? เพื่อใคร? มากกว่า

ถ้าถามว่า OpenData คืออะไร? ก็ตามขื่อคือ การเปิดเผยข้อมูลโดยที่ข้อมูลนั้นสามารถเข้าถึงได้อย่างเสรี ปราศจากปัญหาในเรื่อง copyright, patents หรือการควบคุมอื่นๆ ถ้าเป็นเจ้าของข้อมูลก็ต้องถามว่า ข้อมูลอะไรที่สามารถเปิดเผยได้ ภายใต้เงื่อนไขเหล่านี้ อาจจะต้องทำ data classification ทั้งนี้ต้องทำตาม policy, rules & regulations ซึ่งต้องเอามาดูประกอบด้วยว่าข้อมูลใดสามารถเปิดเผยได้จริงๆ

เปิดทำไม? ก็ต้องดูว่าคนที่ได้ข้อมูลไปสามารถเอาไปทำอะไรได้บ้าง ประโยชน์ที่จะเกิดขึ้นคืออะไร อันนี้ขึ้นอยู่กับข้อมูล รูปแบบข้อมูลและกลุ่มผู้ใช้ข้อมูล เช่น คนทั่วไป, นักพัฒนา, นักวิจัย ซึ่งใช้ข้อมูลแตกต่างกัน ยกตัวอย่างเช่น หากคุณให้ข้อมูลในรูปแบบ csv ขนาด 10GB กับคนทั่วไป เขาก็คงไม่รู้จะเอาไปทำอะไร หากมีการวิเคราะห์ข้อมูลออกมาแล้วคนทั่วไปจะเข้าใจได้่ง่ายขึ้น นักพัฒนาไม่สนใจข้อมูล csv ขนาด 10GB แต่ถ้าสามารถเรียกใช้ผ่าน API ได้ก็จะเหมาะสมกว่า

การแลกเปลี่ยนข้อมูลแบบ machine 2 machine รูปแบบข้อมูลและช่องทางการเข้าถึงข้อมูลยิ่งอยู่ในรูปแบบเฉพาะ เพราะข้อมูลจะต้องอยู่ในรูปแบบ machine readable ซึ่งดีกว่าข้อมูล csv ขนาด 10GB อย่างแน่นอน ทั้งนี้ขึ้นอยู่กับว่า ใครจะเป็นผู้ใช้ข้อมูลของคุณ ซึ่งโดยส่วนใหญ่การเปิดเผยข้อมูลจะใช้ 2 วิธีหลักๆ คือ ข้อมูลดิบเป็นไฟล์ archive เช่น csv, xml, json และข้อมูลที่เรียกผ่าน REST API หรือ Web Service ส่วนใหญ่จะมีรูปแบบ json และ xml เพื่อให้สะดวกในการใช้งานและการแลกเปลี่ยนข้อมูล

เรื่อง License ของข้อมูลก็จำเป็นเช่นกัน ข้อมูลที่อย่างมีเจ้าของและเข้าของก็ต้องให้สิทธิการเข้าถึงข้อมูล การเอาข้อมูลไปใช้ รวมไปถึงการเปลี่ยนแปลงแก้ไข ดังนั้น เจ้าของข้อมูลต้องกำหนด License ข้อมูลที่เผยแพร่ไว้เช่นกัน สำหรับ License ของข้อมูล คุณอาจจะเลือกใช้ OpenData Commons หรือ Creative Commons Data ก็ได้

วิธีการแผยแพร่ข้อมูลอาจทำผ่าน Repository, Web Service, REST API ขึ้นอยู่กับว่าจะให้ข้อมูลกับใคร ใครเป็นผู้ใช้ข้อมูลนั้น เช่น ผู้ใช้ทั่วไป นักพัฒนา เป็นต้น มีโครงการ OpenData Portal หลายโครงการที่น่าสนใจ ซึ่งเก็บข้อมูลเฉพาะทาง เช่น ข้อมูลการใช้จ่ายภาครัฐในโครงการ OpenSpending, ข้อมูลเพื่อการพัฒนาประเทศในกลุ่มลุ่มแม่น้ำโขง, โครงการ Data Portal อย่าง CKAN, โครงการที่เป็นที่สนใจมากคงเป็นข้อมูลการใช้เงินของ US Government ที่เผยแพร่บน GitHub เป็นต้น

Comments are closed.