ビットフィールド | Programming Place Plus　Ｃ言語編　第５６章

ビットフィールド 🔗

構造体や共用体のメンバが使用するメモリの大きさを、ビット単位で指定できます。このような指定が行われたメンバを、ビットフィールド (bit-field) と呼びます。

普通に型を指定するだけでは、もっとも小さい char型を使っても、1バイトを下回ることはできませんが、ビットフィールドを使えば、最小で 1ビットにまで切り詰めることが可能です。

ただし、ビットフィールドは、処理系^📘に依存する部分が非常に多い機能です。移植性^📘を高くすることが難しいので、複数の処理系に対応させたいときは十分に検証するようにしてください。

ビットフィールドを使うには、構造体や共用体の定義の際に、メンバに割り当てるビット数を併記するように記述します。

struct タグ名 {
    型 メンバ名 : ビット数;
    型 メンバ名 : ビット数;
    型 メンバ名;
      :
};

union タグ名 {
    型 メンバ名 : ビット数;
    型 メンバ名 : ビット数;
    型 メンバ名;
      :
};

「ビット数」の指定があるメンバと、指定のないメンバは混在しても構いません。

「ビット数」には、結果が 0 以上になる整数の定数式^📘を指定します。これが、そのメンバの大きさになります。0 の場合は特別な意味を持つので、これは後であらためて説明します。また、メンバの型の本来の大きさを超えることはできません。

ビット数の指定をおこなう場合、そのメンバの型は、int型、signed int型、unsigned int型、_Bool型、あるいは処理系定義^📘の型のいずれかでなければなりません。大きさはビット数の指定で決めるので、型の本来の大きさは無関係です。

int型と signed int型は、この場面に限っては異なる意味を持ちます。signed int型を指定した場合は、必ず符号付き整数ですが、単に int型とした場合の符号の有無は処理系定義^📘です。そのため、ビットフィールドでは、単なる int型は避けた方が無難です。

ビットフィールドの大きさはビット単位ですが、構造体や共用体全体の大きさは、いつもバイト単位です。これは、構造体や共用体のオブジェクト^📘のメモリアドレス^📘を表現できなければならないためです（そうでないと、その構造体や共用体を指すポインタを表現できません）。

実際にどれだけの大きさになるかは処理系が決定することになっており、具体的な大きさは分かりません。なお、この大きさを記憶域単位 (addressable storage unit) と呼びます。

試しに、1バイトを下回るビットフィールドだけを持った構造体を定義して、その大きさを出力してみましょう。

#include <stdio.h>

struct Data {
    signed int a : 5;
};

int main(void)
{
    printf("%zu\n", sizeof(struct Data));
}

実行結果：

Data構造体には、5ビットを割り当てたメンバしかないですが、Visual Studio 2017 や gcc 6.4.0 (MinGW-w64) で確認すると、4 という出力が得られます。つまり、記憶域単位は 4バイトのようです。

もし、構造体全体が１つの記憶域単位で収まらないほど大きいのなら、記憶域単位の倍数の大きさが取られます。

あるビットフィールド(a) が、記憶域単位を使いきらなかった場合、次のビットフィールド(b) がその残りの部分を使おうとします。

このとき、b が必要としているビット数が、a が余らせたビットに納まりきらないときは、入る分だけを入れて、入りきらなかった分を次の記憶域単位へ入れるか（つまり、２つの記憶域単位をまたがるか）、諦めて b の全体を次の記憶域単位へ入れるかは処理系定義^📘です。

このようなルールを把握したうえで、ビットフィールドを並べる順番を工夫しましょう。工夫せずに使うと、トータルのメモリ使用量が減らないかもしれません。たとえば、次のサンプルプログラムを見てください（これは、Visual Studio 2017、gcc 6.4.0 (MinGW-w64) で確認しています）。

#include <stdio.h>

struct Data {
    signed int a : 15;
    signed int b : 20;
    signed int c : 15;
    signed int d : 10;
};

int main(void)
{
    printf("%zu\n", sizeof(struct Data));
}

実行結果：

４つのビットフィールドの合計ビット数は、60ビットです。そのため、8バイト (64ビット) あれば足りるはずですが、構造体全体の大きさは 12バイト (96ビット) になっています。

このような結果になるのは、この環境では、記憶域単位が 32ビットであり、前のビットフィールドが余らせた領域が不足なら使わず、次の記憶域単位を割り当てるからです。

a (15ビット) が余らせた 17ビットでは、b を収めることができないため、a と b が異なる記憶域単位を使います。さらに、b (20ビット) が余らせる 12ビットには c が収まらないため、c もまた新たな記憶域単位を使ってしまいます。c (15ビット) が余らせる 17ビットに d は収められるので、c と d は同じ記憶域単位を使います。

つまり、以下のような状態です。

ここでは、各ビットフィールドが、１つの記憶域単位内でメモリアドレスの下位から上位へ向かって配置されるようにイメージしています。この点に関しても処理系定義^📘となっており、上位から下位へ向かって配置されることもあります。

ビットフィールドの並び順を組み替えてみます。

#include <stdio.h>

struct Data {
    signed int a : 15;
    signed int c : 15;
    signed int b : 20;
    signed int d : 10;
};

int main(void)
{
    printf("%zu\n", sizeof(struct Data));
}

実行結果：

今度は 8バイトになりました。

a が余らせた 17ビットの中に c (15ビット) を収められるので、a と c が１つの記憶域単位を共有できます。また、b は新たな記憶域単位を使いますが、12ビット余るので、d (10ビット) を収められます。

つまり、以下のような状態です。

繰り返しになりますが、この結果は、記憶域単位が 32ビットであり、前のビットフィールドが余らせた領域が不足なら使わず、次の記憶域単位を割り当てる環境での話です。ルールが異なる環境では結果はまるで違ったものになります。

名前のないビットフィールド 🔗

ビットフィールドのメンバ名は省略できます。この場合、名前のないビットフィールド (unnamed bit-field) となります。

名前のないビットフィールドは、名前がないので、参照できません。利用価値がないようですが、そこに確かにビットは割り当てられるので、明示的にビット単位のパディング^📘を入れる効果があります。

たとえば、メンバが 16ビットの倍数の位置にあることが求められているとすると、以下のようにパディングを入れることで対応できます。

struct Data {
    signed int a : 15;
    signed int   : 1;  // 1ビットのパディング
    signed int b : 12; // 16ビット目から割り当て
};

また、後述するように、0ビットの指定をおこなうために、名前のないビットフィールドが必要です。

0 ビットの指定 🔗

名前のないビットフィールドでは、ビット数の指定を 0 にできます。これは、前のビットフィールドが使いきらなかった、記憶域単位の残りを使わないことを意味します。

ここまでに見てきたように、前のビットフィールドが余らせた記憶域単位の残りを、次のビットフィールドが使うかどうかは処理系定義^📘であり、制御できませんが、0ビットのビットフィールドを使うと「使わせない」という制御ができます。

#include <stdio.h>

struct Data {
    signed int a : 15;
    signed int   : 0;   // 余った領域は使わせない
    signed int b : 10;  // 新しい記憶域単位を使う
    signed int c : 20;
    signed int d : 10;
};

int main(void)
{
    printf("%zu\n", sizeof(struct Data));
}

実行結果：

この構造体は、メモリを以下のように使うと考えられます。

ビットフィールドの使い方 🔗

ビットフィールドは、メモリアドレスを取得できないことに注意してください。メモリアドレスはバイト単位で割り振られているものなので、中途半端なビット位置に値を格納している可能性があるビットフィールドでは、メモリアドレスを表現できないことがあるからです。

この点を除けば、構造体や共用体のビットフィールドでないメンバと変わりありません。ビットフィールドへのアクセスは、ドット演算子やアロー演算子を使って行えます。

#include <stdio.h>

struct Data {
    signed int a : 5;
    unsigned int b : 3;
    int c;
};

int main(void)
{
    struct Data data = {15, 7, 100};

#if 0
    int* pb = &data.b;  // コンパイルエラー
#endif
    int* pc = &data.c;  // OK

    printf("%d %u %d\n", data.a, data.b, data.c);
}

実行結果：

15 7 100

ビットフィールドの価値として分かりやすいのは、極限まで小さな領域にデータを詰め込める点です。しかし、中途半端なビットにある置かれている値をアクセスするには、処理時間が余分に必要であることが多いです。これは、いったんバイト単位でアクセスしてから、必要なビットを切り出してくるような処理が必要になるためです。

メモリが非常に少ない環境では、この用途でビットフィールドを使うことに価値があるかもしれません。しかし、メモリが十分に豊富な環境では、節約の意味がほとんど無いうえに、処理速度も低下する恐れがあるため、ほとんど価値がありません。

もう１つの利用箇所は、フォーマット（形式）が厳密に定められているようなデータを扱わなければならないときです。たとえば「先頭から 4ビットがこういう意味の値、次の 6ビットでこれを表現し、次の 6ビットで・・・」といったようなデータです。ビット演算^📘でも実現できますが、ビットフィールドを使った方が簡単な可能性があります。

練習問題 🔗

問題①　1ビットのビットフィールドを１つだけ持つ構造体の大きさがどれだけになるか、調べてみてください。

解答ページはこちら。

参考リンク 🔗

Programming Place Plus　Ｃ言語編　参考書籍
- 当サイトの参考書籍一覧ページ。Ｃ言語に関する書籍を多数紹介
Programming Place Plus　Ｃ言語編　リンク集
- 当サイトの参考Webサイト集。Ｃ言語の全般的な学習に有益なサイトを紹介

更新履歴 🔗

2024/5/26
- ビットフィールドに _Bool型を用いたときのコラムを削除（話が細かすぎるうえ、まず必要性がないと思われるので）
2023/3/5
- コーディング規約を統一（要素を書き並べるとき { の直後と、} の直前に空白を入れない）
2023/2/12
- 初出の重要用語に英語表記を併記
2023/2/4
- コーディング規約を統一（実引数がある関数呼び出しの ( の直後、) の直前に空白を入れない）
2021/12/11
- main関数から return 0; を削除（Ｃ言語編全体でのコードの統一）

≪さらに古い更新履歴≫

2019/8/6
- 「コンパイラ」よりも「処理系」の方が適切ならば、「処理系」と書くように統一
2019/7/18
- 解説のベースを C99 に上げる対応
  - ビットフィールドに _Bool型を使った場合についてのコラムを追加
  - コメントを // 形式で統一
2019/7/9
- 解説のベースを C99 に上げる対応
  - size_t型の出力に “%zu” を使うように修正
2018/5/22
- 全体的に内容を強化。
2018/5/19
- 新規作成第５５章に含まれていた内容を移動してきた。

前の章へ　（第５５章　共用体）

次の章へ　（第５７章　最適化に関する機能）

Ｃ言語編のトップページへ

Programming Place Plus のトップページへ

はてなブックマークに保存	Facebook でシェア	X でポスト／フォロー
LINE で送る	noteで書く	RSS
管理者情報	プライバシーポリシー

このページの概要 🔗