HTMLのテーブルを​読み取ると、日本語が​文字化けしてしまいま​す。

14 views (last 30 days)
一眞 青木
一眞 青木 on 1 Dec 2022
Commented: Kojiro Saito on 1 Dec 2022
日本語の文字を含むHTMLをreadtableを実行してテーブルを読み取ったとき、日本語が文字化けしてしまうのはなぜですか?
以下のコマンドを実行し読み取りました。
opt = htmlImportOptions('TableSelector',"//TABLE[1]");
table = readtable(url,opt);

Accepted Answer

Kojiro Saito
Kojiro Saito on 1 Dec 2022
Edited: Kojiro Saito on 1 Dec 2022
エンコードが合っていないためだと思われます。readtableにweboptionsも引数に入れられるので、日本語の文字コードを指定してみたらどうでしょうか。
webopts = weboptions('CharacterEncoding', 'Shift_JIS');
% webopts = weboptions('CharacterEncoding', 'UTF-8');
table = readtable(url,opt, 'WebOptions', webopts)
  2 Comments
一眞 青木
一眞 青木 on 1 Dec 2022
ありがとうございます。ご指摘の通りにやり直したら解決しました。
Kojiro Saito
Kojiro Saito on 1 Dec 2022
解決して良かったです。

Sign in to comment.

More Answers (0)

Categories

Find more on データ型の変換 in Help Center and File Exchange

Community Treasure Hunt

Find the treasures in MATLAB Central and discover how the community can help you!

Start Hunting!