今回のテーマ
みなさん、こんにちは!
デジタルステーション習志野スタッフの小島です。
今日はPCがファイルをどのように識別しているのかを説明します。
ファイル
ファイルの扱い
PCは0と1の2種類の文字だけで数字を管理しているのは知っているかな?
実は文字が書かれているようなテキストファイルや画像ファイルも中身は数字で管理されています。
そもそもファイルって?
ファイルは元々は保存された情報を指す言葉だったんだけど、今ではまとめられた情報群を指すときに使われます。
普段から使っている画像や音声、テキストなどの1つ1つがファイルと呼べるよ。
それらのファイルは、名前とは別に拡張子というもので区別されます。
拡張子
ファイルの識別
拡張子はそのファイルが画像なのかテキストなのか、はたまはプログラムコードなのかをPC側で区別するためのものです。
この拡張子によってPCは実行すべきアプリケーションやソフトウェアを自動で選んでくれます。
例えば、「.png」という拡張子のファイルをWindowsでダブルクリックした時に、自動で画像を表示してくれるのは、この拡張子で区別できるからです。
拡張子の特徴
拡張子の多くはアルファベット3文字以内のものが多いです。これは最初に拡張子を利用したファイルの識別を行っていたOS(TOPS-10:DECという企業が1967年に開発したOS)が名前8文字と拡張子3文字という制限があった影響というのが通説です。
現在では、この制限はなくなったため変則的な拡張子を見る機会も増えてきました。(Pythonの上位互換?として少し話題のMojo言語の拡張子は🔥らしいです)
まとめ
今回はPC内でファイルの識別に使用される拡張子について説明しました。
拡張子ができる前は直接ファイルデータに何のデータか書き込んだり、ファイルの保存場所等で区別されていたようです。
そう考えると、拡張子のおかげでファイルの扱いがかなり自由になりました。
おまけ
拡張子の罠!?
拡張子を使ったクラッカー(PCに悪意をもってウィルスを送ったりハッキングをしたりする悪いハッカー)の攻撃が存在します。
以下のファイル群のは一見すると、1つのテキストファイルと3つの画像ファイルのように思えます。
しかし、よく見ると、「good.txt」はアプリケーションなんです。
これは、アプリケーションの名前に拡張子を付けることによって、テキストの内容を確認しようとしたユーザにアプリケーションの実行をさせる手口です。
これによりクラッカーが情報を盗むソフトウェアを実行させたり、遠隔でPCを操作できるようになってしまいます。
見知らぬファイルがあっても無暗にクリックしないように注意しましょう!
デジタルステーション習志野
〒274-0063 船橋市習志野台4-1-7 習志野駅前郵便局2F