今後データベースについて解説する記事を掲載します。
今回は、そもそもデータとは何か、ということを解説します。
データの語源
“データ(data)”という言葉は、ラテン語の “datum”(与えられたもの、情報)に由来します。この言葉はもともと、与えられた情報や証拠を指す言葉でした。イメージとしては、法律の文脈での口頭での証言や物的な証拠(例えば、目撃者の話や物的証拠)や、文書や記念碑、彫刻がわかりやすいかもしれません。
英語の “data” として広く使われるようになったのは19世紀後半から20世紀初頭にかけてです。その歴史を紹介する前に、まず現代における”データ(data)”と”情報(information)”の違いについて整理してみます。
データと情報のちがい
“データ(data)“と”情報(information)“は似たようで異なる概念です。以下に情報とデータの違いを説明します。
データは、単に事実や値の集合を指します。その表現媒体は文字、数字、画像、音声など多様な形式を取ります。データは単に存在するだけで、意味や文脈が与えられるまでは情報としての意味を持ちません。
一方情報は、データに意味や解釈が与えられた状態を指します。データが整理され、意味のあるコンテキストで提示されることで情報として機能します。
例えば、数値の”100″はそれ単体としてはデータです。このデータだけではその意味がわかりませんが、”商品の価格が100円である”という文脈が与えられれば情報としての意味を持ちます。
データは単なる事実や値の集合であり、情報はそのデータに意味や文脈が与えられて理解しやすくなったもの、ともいえるかもしれません。
データの歴史
では次に、情報とデータを歴史的な文脈から解説します。
ざっくり中世までは、情報とデータの区別はあまり明確ではありませんでした。より正確に言えば、情報が重視されたり記録されることは有っても、データが重視されるということは多くありませんでした。例えば、貿易の記録や歴史的な出来事の記録は”情報”ですが、それは現代のように”データ”として扱われることはありませんでした。
データが重視されるようになるのは近代以降です。以下では、科学革命、産業革命、IT革命という3つの軸で解説します。
まず17-18世紀の科学革命です。この時期にはガリレオが地動説を唱え、古典物理学の基盤を構築したニュートンが活躍しました。他にも、ボイル、ケプラー、パスカル、ハーレーなどもこの時代です。科学革命の時代には、観測データや実験結果が重要視され、科学的なデータが新たな知識や理論を構築するための基盤となりました。
次に18-19世紀の産業革命です。産業革命により工業生産が拡大し、資本家による企業活動の規模が拡大したことで、大量の生産データや経済データが生成されました。企業や産業界で、効率化や生産性向上のためにデータが重視されるのは、現代人なら直感的に理解できるはずです。
そして最後に、IT革命です。こちらは言わずもがなでしょうか。コンピュータの普及によりデータの収集や蓄積が誰でも可能となり、大きく普及しました。更には第四次産業革命ともいわれるAIブームの中で、データの重要性はますます高まっています。AIブームについては以下を参照ください。
コメント