文字列の後ろの方から文字列を探す | Programming Place Plus　Ｃ言語編　逆引き

このページの概要 🔗

以下は目次です。

目的
方法①（自力で実装する）

目的 🔗

文字列の中から、任意の文字列を探したいとします。ただし、文字列の末尾に近いものを探すという条件があるとしましょう。

先頭に近いものを探す方法は、「逆引き　文字列から文字列を探す」で取り上げています。

逆向きに探すという意味ではないことに注意してください。たとえば、“abcdabcd” から “abc” を探す場合、“abc” は２つありますが、後ろから４文字目のところから始まる “abc” のほうを見つけてほしいということです。

この要求はつまり、ある文字列が含まれているかどうかだけではなく、どこにあるかも重要だということでもあります。したがって、bool型の結果を返すのではなく、見つかった文字列を指すポインタを返すように考えます。添字が必要なら、ポインタの減算（第３２章）で対応できます。

/*
    文字列の後ろの方から文字列を探す。

    引数
        s: 対象の文字列
        target: 探す文字列
    戻り値
        見つかったら、その文字列の先頭の文字のメモリアドレス。
        見つからなかったらヌルポインタ。
*/
char* find_last_string(const char* s, const char* target);


int main(void)
{
    const char s[] = "abcdabcd";

    // 最後に現れる位置を調べる
    char* p = find_last_string(s, "abc");

    // 何文字目にあったか
    if (p != NULL) {
        ptrdiff_t index = p - s;
    }
}

方法①（自力で実装する） 🔗

標準ライブラリには、この目的に合った関数がありません。先頭から文字を探す strchr関数に対して、末尾に近い文字を探す strrchr関数があるように、先頭から文字列を探す strstr関数に対応する strrstr関数があってもよさそうですが、標準にはありません。

自力で実装します。

#include <stdio.h>
#include <string.h>

/*
    文字列の後ろの方から文字列を探す。

    引数
        s: 対象の文字列
        target: 探す文字列
    戻り値
        見つかったら、その文字列の先頭の文字のメモリアドレス。
        見つからなかったらヌルポインタ。
*/
char* find_last_string(const char* s, const char* target)
{
    const size_t s_len = strlen(s);
    const size_t target_len = strlen(target);

    // target の方が長いのなら、見つかることはない
    if (s_len < target_len) {
        return NULL;
    }

    // target の文字数を考慮して、探す意味がある一番後ろ側の位置を計算
    size_t index = s_len - target_len;

    for (;;) {

        // 現在位置で一致確認
        if (strncmp(&s[index], target, target_len) == 0) {
            return (char*)&s[index];
        }

        // 一致しなかったら、探す位置を先頭側へ１文字ずらす
        // すでに先頭を見ていたのなら終了
        if (index <= 0) {
            return NULL;
        }
        --index;
    }

    return NULL;
}


int main(void)
{
    const char s[] = "abcdabcd";

    char* p = find_last_string(s, "abc");
    if (p == NULL) {
        puts("not found");
    }
    else {
        printf("found. (%td)\n", p - s);
    }
}

実行結果：

found. (4)

まず、対象の文字列 (s) と探したい文字列 (target) の長さを取得し、探す意味のあるもっとも後ろ側の位置を計算します。s が 8文字、target が 3文字なら、&s[5] から調べ始めます。&s[6] から調べても、残りの文字数が 2文字しかないので、3文字の target と一致するはずがないからです。また、s より target の方が長い場合は、さっさと「見つからない」と返してしまえます。

文字列の一致確認は、strncmp関数で行っています。一致すれば、今回の調査位置のメモリアドレスを返して終了します。一致しなければ、探す位置を s の先頭の側へ１文字ずらして続行します。

探す位置が s の先頭（index == 0) のときに strncmp関数が「一致しない」と判定した場合、target は含まれていませんから、ヌルポインタ^📘を返して終了させます。

この実装が必ずしも効率的であるということではありません。アルゴリズムとデータ構造編があつかうような内容になってしまうので、ここでは触れませんが、文字列探索には、ボイヤームーア法（参考リンク１）など、より効率的なアルゴリズムがあります。

参考リンク 🔗

ボイヤー-ムーア文字列検索アルゴリズム | Wikipedia

Programming Place Plus　Ｃ言語編　参考書籍
– 当サイトの参考書籍一覧ページ。Ｃ言語に関する書籍を多数紹介。
Programming Place Plus　Ｃ言語編　リンク集
– 当サイトの参考Webサイト集。Ｃ言語の全般的な学習に有益なサイトを紹介。

更新履歴 🔗

2021/12/11
- main関数から return 0; を削除（Ｃ言語編全体でのコードの統一）
2019/12/23
- 新規作成

逆引きのトップページへ

Ｃ言語編のトップページへ

Programming Place Plus のトップページへ

はてなブックマークに保存	Facebook でシェア	X でポスト／フォロー
LINE で送る	noteで書く	RSS
管理者情報	プライバシーポリシー