simplexml_load_fileでWordPressのRSSを読み込もうとしてエラーになった原因

この記事は約6分で読めます。
この記事は最終更新日から8年経過しています。内容が古い可能性があります。

WordPressのRSSフィードをPHPで読むというプログラムをちょこっと書こうと思って、いきなりつまづきました。なぜかエラーが出てしまい、どのサイトで見つけたコードでも上手く行きません。
しかし、エラーメッセージで探してもなかなか同じような事例にあたらず。。結局分かった原因は、意外なところにありましたのでそれについて書きます。

スポンサーリンク

simplexml_load_file でRSSフィードが読み込めなかった状況

こんな感じのコードを書きました。

<?php
$feed = simplexml_load_file("https://usortblog.com/feed/",'SimpleXMLElement',LIBXML_NOCDATA);
echo "<pre>";var_dump($feed);echo "</pre>";

これだけで、このblogのfeedを取得して内容を表示するはずです。(ブラウザでも見ることが出来ます→こちら)

しかし、実行してみたところ

Warning: simplexml_load_file(): https://usortblog.com/feed/:2: parser error : Extra content at the end of the document in C:\xampp54\htdocs\ryustool\mikatest.php on line 9

Warning: simplexml_load_file(): <b>Notice</b>: Undefined index: HTTP_USER_AGENT in <b>/virtual/ryus/ryuscojpblo in C:\xampp54\htdocs\ryustool\mikatest.php on line 9

こんなエラーが出てしまいました。該当している行は、simplexml_load_file を使っているところです。

URLがおかしいのかな?とか見直してみますが、ブラウザではそのときでもちゃんと表示されていたのでURLがおかしいということも無いと思いました。

うーん。。。試しにWordPressで作られていると思われる、他のサイトのFEEDのURL<を入れて、このプログラムで表示したところ、意図通りに表示されました。

同じWordPressのRSSフィードが表示されている、ブラウザでは表示されているけれど プログラムから自分のサイトのfeed取得しようとするとエラーに! なってしまいます(>_<)

simplexml_load_fileではなく、file_get_contentsで確認して原因が判明

何が原因かわからないのですがどうも Undefined index: HTTP_USER_AGENT って…、なんか普通にPHPでよく見るエラーのような。

ということで、file_get_contents で確認してみました。すると、

$content = file_get_contents('https://usortblog.com/feed');
var_dump($content);

string(445) "<br />
<b>Notice</b>:  Undefined index: HTTP_USER_AGENT in <b>/virtual/ryus/ryuscojpblog/wp-content/themes/twentyfourteen-ryus/functions.php</b> on line <b>579</b><br />
<br />
<b>Warning</b>:  Cannot modify header information - headers already sent by (output started at /virtual/ryus/ryuscojpblog/wp-content/themes/twentyfourteen-ryus/functions.php:579) in <b>/virtual/ryus/ryuscojpblog/wp-includes/pluggable.php</b> on line <b>1178</b><br />

うっ… 

themes/twentyfourteen-ryus/functions.php on line 579

なんですと~(>_<)。自分が色々いじっているfunctions.phpで Undefined index: HTTP_USER_AGENT に関する、NoticeやWarningが発生しています。該当する行を見ると、

    return preg_match($pattern, $_SERVER['HTTP_USER_AGENT']);

と、あります。これは…PHPを書く人なら心当たりのある「該当する配列が存在しないのに isset とかで存在を確認せずに、存在するものとして使ったときのワーニング」です。ブラウザからアクセスすればここには HTTP_USER_AGENT の配列が存在するはずですが、PHPから直接呼ばれるのでこの配列は存在しません。

そのためにワーニングメッセージが返されて、ワーニングメッセージはxmlじゃなから、simplexml_load_file がエラーという判定を下してしまうようです。

ということで、この行のコーディングを

    $useragent = '';
    if (isset($_SERVER['HTTP_USER_AGENT'])){
        $useragent = $_SERVER['HTTP_USER_AGENT'];
    }
    return preg_match($pattern, $useragent);

こんな感じに変更して、無事、

object(SimpleXMLElement)#1 (2) {
  ["@attributes"]=>
  array(1) {
    ["version"]=>
    string(3) "2.0"
  }
  ["channel"]=>
  object(SimpleXMLElement)#2 (7) {
    ["title"]=>
    string(9) "RYUS blog"
    ["link"]=>
    string(22) "https://usortblog.com"
    ["description"]=>
    string(23) "株式会社RYUSのblog"
    ["lastBuildDate"]=>
    string(31) "Fri, 17 Apr 2015 00:30:18 +0000"
    ["language"]=>
    string(2) "ja"
    ["generator"]=>
    string(29) "http://wordpress.org/?v=4.1.1"
    ["item"]=>
    array(10) {
      [0]=>
      object(SimpleXMLElement)#3 (7) {

simplexml_load_file を使って、RSSフィードを読み込むことに成功しました(^^)/

まとめ:functions.phpの利用は気をつけましょう!!!

と、自分が言うのもアレですが(^_^;、つい簡単に手が入れられるので色々追加してしまうfunctions.phpですが、今回のようにすべての場合に通るようなコードを書いた場合はワーニングも出ないように完璧な感じのコードにしておかないと、おもいがけないところでエラーが出てしまうので気をつけましょう!

兎本美佳

ブログを見た人がそのままできたらいいなと思って、できるだけ丁寧に書いています。blogに書いたようなネタの有償対応のご相談は「ゆうそうと」へいただければと思います(^^)/
無償での対応をご希望の場合は、コメントをいただけましたら可能な場合はコメントを返させていただきます。

ゆうそうとITブログの更新通知が受け取れます!
スポンサー広告

WordPress全般php開発言語
スポンサーリンク
ゆうそうとITブログの更新通知が受け取れます!
ゆうそうとITブログ

コメント

トップへ戻る

ゆうそうとについての説明

ゆうそうと とは東京都八王子市を中心として、WordPressによるWEBサイトの作成や、スポットでのIT相談を行ったり、年間契約でのIT顧問をなりわいとして活動しています。

特徴としては30年以上IT業界でプログラムを中心として仕事をしてきたものと、美大出身のデザイナーがワンストップで対応するため、幅広い対応が可能であることです。

IT相談は直接お会いしてのご相談の他、ZOOMによるオンライン相談も可能です。