
WordPressのRSSフィードをPHPで読むというプログラムをちょこっと書こうと思って、いきなりつまづきました。なぜかエラーが出てしまい、どのサイトで見つけたコードでも上手く行きません。
しかし、エラーメッセージで探してもなかなか同じような事例にあたらず。。結局分かった原因は、意外なところにありましたのでそれについて書きます。
simplexml_load_file でRSSフィードが読み込めなかった状況
こんな感じのコードを書きました。
<?php
$feed = simplexml_load_file("https://usortblog.com//feed/",'SimpleXMLElement',LIBXML_NOCDATA);
echo "<pre>";var_dump($feed);echo "</pre>";
これだけで、このblogのfeedを取得して内容を表示するはずです。(ブラウザでも見ることが出来ます→こちら)
しかし、実行してみたところ
Warning: simplexml_load_file(): https://usortblog.com//feed/:2: parser error : Extra content at the end of the document in C:\xampp54\htdocs\ryustool\mikatest.php on line 9 Warning: simplexml_load_file(): <b>Notice</b>: Undefined index: HTTP_USER_AGENT in <b>/virtual/ryus/ryuscojpblo in C:\xampp54\htdocs\ryustool\mikatest.php on line 9
こんなエラーが出てしまいました。該当している行は、simplexml_load_file を使っているところです。
URLがおかしいのかな?とか見直してみますが、ブラウザではそのときでもちゃんと表示されていたのでURLがおかしいということも無いと思いました。
うーん。。。試しにWordPressで作られていると思われる、他のサイトのFEEDのURL<を入れて、このプログラムで表示したところ、意図通りに表示されました。
同じWordPressのRSSフィードが表示されている、ブラウザでは表示されているけれど プログラムから自分のサイトのfeed取得しようとするとエラーに! なってしまいます(>_<)
simplexml_load_fileではなく、file_get_contentsで確認して原因が判明
何が原因かわからないのですがどうも Undefined index: HTTP_USER_AGENT って…、なんか普通にPHPでよく見るエラーのような。
ということで、file_get_contents で確認してみました。すると、
$content = file_get_contents('https://usortblog.com//feed');
var_dump($content);
string(445) "<br />
<b>Notice</b>: Undefined index: HTTP_USER_AGENT in <b>/virtual/ryus/ryuscojpblog/wp-content/themes/twentyfourteen-ryus/functions.php</b> on line <b>579</b><br />
<br />
<b>Warning</b>: Cannot modify header information - headers already sent by (output started at /virtual/ryus/ryuscojpblog/wp-content/themes/twentyfourteen-ryus/functions.php:579) in <b>/virtual/ryus/ryuscojpblog/wp-includes/pluggable.php</b> on line <b>1178</b><br />
うっ…
themes/twentyfourteen-ryus/functions.php on line 579
なんですと~(>_<)。自分が色々いじっているfunctions.phpで Undefined index: HTTP_USER_AGENT に関する、NoticeやWarningが発生しています。該当する行を見ると、
return preg_match($pattern, $_SERVER['HTTP_USER_AGENT']);
と、あります。これは…PHPを書く人なら心当たりのある「該当する配列が存在しないのに isset とかで存在を確認せずに、存在するものとして使ったときのワーニング」です。ブラウザからアクセスすればここには HTTP_USER_AGENT の配列が存在するはずですが、PHPから直接呼ばれるのでこの配列は存在しません。
そのためにワーニングメッセージが返されて、ワーニングメッセージはxmlじゃなから、simplexml_load_file がエラーという判定を下してしまうようです。
ということで、この行のコーディングを
$useragent = '';
if (isset($_SERVER['HTTP_USER_AGENT'])){
$useragent = $_SERVER['HTTP_USER_AGENT'];
}
return preg_match($pattern, $useragent);
こんな感じに変更して、無事、
object(SimpleXMLElement)#1 (2) {
["@attributes"]=>
array(1) {
["version"]=>
string(3) "2.0"
}
["channel"]=>
object(SimpleXMLElement)#2 (7) {
["title"]=>
string(9) "RYUS blog"
["link"]=>
string(22) "https://usortblog.com/"
["description"]=>
string(23) "株式会社RYUSのblog"
["lastBuildDate"]=>
string(31) "Fri, 17 Apr 2015 00:30:18 +0000"
["language"]=>
string(2) "ja"
["generator"]=>
string(29) "http://wordpress.org/?v=4.1.1"
["item"]=>
array(10) {
[0]=>
object(SimpleXMLElement)#3 (7) {
simplexml_load_file を使って、RSSフィードを読み込むことに成功しました(^^)/
まとめ:functions.phpの利用は気をつけましょう!!!
と、自分が言うのもアレですが(^_^;、つい簡単に手が入れられるので色々追加してしまうfunctions.phpですが、今回のようにすべての場合に通るようなコードを書いた場合はワーニングも出ないように完璧な感じのコードにしておかないと、おもいがけないところでエラーが出てしまうので気をつけましょう!



コメント