コンピュータやソフトウェアのあれこれ@道民(&元道民)
API
ATNDのイベントリマインダを作ってみた
1月 30th
atnd_remainder
http://twitter.com/atnd_remainder
自分が登録したATNDのイベントの開催前日21:00に、イベント内容をDMしてくれるbotを作りました。
困っていたこと
勢い込んでATNDがたってすぐに参加申し込みをすると…
- イベント当日の場所が曖昧
- イベントの開催時間の把握が曖昧
- 参加したATNDをいちいちさがすのも手間
ときどき、こんなことがありました(´・ω・`)
欲しかったもの
作る前に書いたメモ
DBにATND登録ユーザー名(nickname)とtwitter_idを登録
前日1回、前日夜21:00にDMを送る
・相互フォロー前提
・登録フォームはあとで
つかったもの
- ATND API
- TwitterAPI
- OAuthAPIを使うモジュール(自前)
- OAuthAPIを使ってTwitterに投稿するモジュール(自前)
- MySQLにアクセスするモジュール
以前に作ったtwitterbotの部品を使ったので、新しく作った部分はATNDのAPIを呼ぶところくらいでしょうか。
TwitterAPIのDMを送信するAPIも初めてつかいました。
あとは今まで作ったものを参考にしていきました。
登録フォームがない
そのため、現在私のIDしか登録されていません。。。。
もし、使ってみたいという人がいたら、@irasallyにご連絡ください。
しばらく手動で登録します。
尚、DMを送信するので @atnd_remainderのフォローをよろしくお願いします。
今後やってみたいこと
- 自動で登録できるフォーム
- ユーザーごとにリマインドする時間を変えられる
- DMじゃない方法でのリマインド(メールとか)
メール送信はやったことがないので難易度が高い・・・
最後に
勢いで作ってみたがそういうサービスもうあるんじゃないだろうか。
まあ、自分用として使う分にはじゅうぶんなので、
これからは、イベントの場所とか時間とか間違わないようにしたいです。
Tidy関数を使ったスクレイピングとTwitterAPI(2)-TwitterAPI::update
2月 24th
Twitterに投稿をpostしたり、タイムラインを取得したりすることができるTwitterAPI。
(仕様日本語訳:[観] Twitter API 仕様書 (勝手に日本語訳シリーズ))
PHPでTwitterAPIを使用できるPEARライブラリもあるのだけど(Services_Twitter)
勉強を兼ねて自分でクラスを作成してみました。
今後、タイムライン取得や、返信取得も必要に応じて増やしていく予定。
TwitterAPI::updateを呼び出す
PEARライブラリのHTTPRequestを使用しています。
主な流れは
●引数として渡されたID・PASSWORDでBASIC認証を行う
●POSTデータに投稿内容をセット
●URL( http://twitter.com/statuses/update.xml )にPOSTを使用したHTTPリクエスト送信
●レスポンスコードとして200が返ってくれば投稿成功
となります。
//TwitterAPI.class.php
class TwitterAPI {
// ########## TwitterにPOSTする
public function update( $status , $id , $pass ) {
require_once "HTTP/Request.php";
$api_url = "http://twitter.com/statuses/update.xml";
$req = new HTTP_Request($api_url);
$req->setMethod(HTTP_REQUEST_METHOD_POST);
$req->setBasicAuth($id, $pass);
$req->addPostData("status" , $status );
if(!PEAR::isError( $req->sendRequest())){
return $req->getResponseCode();
} else {
return false;
}
}
}
[プロキシを介してインターネットに接続している場合]
以下のようにして、プロキシ設定を追加します。
$req = new HTTP_Request($api_url);
//...(略)
$req->setProxy("your_proxy", 8888);
//...(略)
if(!PEAR::isError( $req->sendRequest())){
....
TwitterAPIクラス使用方法
自作したTwitterAPIクラスは以下のようにして使用します。
IDとパスワードは呼び出し時に自由に設定できるようにしてあります。
// オブジェクト生成 $tap = new TwitterAPI(); $status = "投稿内容文字列"; $tap->update( $status , ID , PASS );
札幌市 水道凍結情報( http://twitter.com/sap_freezer )
いままで作成したクラスを組み合わせて、TwitterBotを作成しました。
Twitter / sap_freezer
メイン実行クラスは以下のようになっています。
#!/usr/local/php5/bin/php
<php?
// 水道情報局のURL
define('INIT_URL' , "http://www.sweb.co.jp/tenki/cgi/freeze.cgi");
// twitter API POST
define('ID' , "twitterID");
define('PASS' , "twitterPassWord");
require_once "GetHttpSource.class.php";
require_once "Scraping.class.php";
require_once "TwitterAPI.class.php";
// HTMLの取得
$ca = new GetHttpSource();
$data = $ca->get_html(INIT_URL);
// Tidy関数config
$config = array('indent' => TRUE,
'output-xhtml' => TRUE,
'wrap' => 200);
// 取得したHTMLファイルの内容をUTF-8の文字コードで$configで指定した設定で、tidyオブジェクトを作成
$tidy = tidy_parse_string($data, $config, 'UTF8');
// cleanRepairで整形
$tidy->cleanRepair();
// スクレイピング処理
$scr = new Scraping();
$result_array = $scr->scraping_data($tidy->body());
$result_date = $scr->scraping_date_data($tidy->body());
// UPDATEする
$tap = new TwitterAPI();
foreach( $result_array as $area_r ){
$status = "[".$area_r["center"]."::水道凍結情報] 今夜は【".$area_r["sfont1"]."】です。明日は【".$area_r["sfont2"]."】です。(".$result_date.")".INIT_URL;
if( $result = !$tap->update( $status , ID , PASS ) ){
echo"APIエラー";
} else {
echo $result ." " ;
echo $status ;
}
}
?>
はじめて作ったTwitterのBOT、感慨深いです。
一年ぶりにソースを見直したら、改善できそうなところが・・・・
そこに成長を感じたりもします。
Tidy関数を使ったスクレイピングとTwitterAPI(1)-Tidy関数でスクレイピング
2月 24th
APIとして使いやすい(動くサービスが作りやすい)TwitterのAPIを使って
昨年から少しずつ、Twitter-bot(自動投稿プログラム)を作成していました。
せっかくなので、ここにまとめておきたいと思います。
札幌市水道凍結情報配信bot
「水道凍結情報」-さっぽろお天気ネット-で公開されている情報を
WEBページから取得し、毎晩Twitterに配信するというbotです。
一定期間、一定地域にしかニーズはありません。
が、これも勉強です。
スクレイピング処理
今回スクレイピングしたかったHTMLはこんなソースです。
<tr>
<td>
<p class=center>中央区</p>
</td>
<td>
<img src="../images/freeze3.gif" alt="注意">
<span class=sfont>注意</span>
</td>
<td>
<img src="../images/freeze2.gif" alt="念のため">
<span class=sfont>念のため</span>
</td>
</tr>
ここから class=center と class=sfont の中身を3つセットで取り出したい。
取り出すために必要になる処理は大雑把にいうと以下となります。
◇ html情報を文字列として取り出す
◇ Tidy関数を使用し、文字列にストアされたドキュメントをパースする
◇ パースしたTidyオブジェクトを操作して、html情報を切り出す
◇html情報を文字列として取り出す
fopen関数を使って指定URLの情報を取得します。
//GetHttpSource
class GetHttpSource {
public function get_html($url){
if (($fp = fopen($url, "r")) == FALSE) {
$this->status = "エラーが発生しました。";
return;
}
$str = fgets($fp);
while (! feof($fp)) {
$str = $str . fgets($fp);
}
fclose($fp);
$data = mb_convert_encoding($str,"utf-8","auto");
return $data;
}
}
[プロキシを介してインターネットに接続している場合]
fsockopenを使います。
$proxy_name = 'your_proxy';
$proxy_port = 8888;
$proxy_cont = '';
$proxy_fp = fsockopen($proxy_name, $proxy_port);
if ( $proxy_fp == false ) {
echo "Error!!";
return false;
}
// プロキシ情報を付加してファイル取得
fputs($proxy_fp, "GET $proxy_url HTTP/1.0\r\nHost: $proxy_name\r\n\r\n");
while(!feof($proxy_fp)) {$proxy_cont .= fread($proxy_fp,4096);}
fclose($proxy_fp);
// プロキシ情報を除去してデータとして格納する
$data = mb_convert_encoding(substr($proxy_cont, strpos($proxy_cont,"\r\n\r\n")+4),"utf-8","auto");
return $proxy_cont;
◇Tidy関数を使用し、文字列にストアされたドキュメントをパースする
PHP: Tidy – Manualを参考に。
Tidy 関数 parseString() と cleanRepair() を使用します。
// HTMLの取得
$ca = new GetHttpSource(); // 自作クラス
$data = $ca->get_html(INIT_URL);
// Tidy関数config
$config = array('indent' => TRUE,
'output-xhtml' => TRUE,
'wrap' => 200);
// 取得したHTMLファイルの内容をUTF-8の文字コードで$configで指定した設定で、tidyオブジェクトを作成
$tidy->parseString($data, $config, 'UTF8');
// パースされたマークアップに設定に基く誤りの修正を行う
$tidy->cleanRepair();
◇パースしたTidyオブジェクトを操作して、html情報を切り出す
ノードとして保持されているTidyオブジェクト内の情報を、再帰的に読み込み、
必要な情報だけを取り出します。
当日(当夜)予想と翌日(日中)予想を判断するのは「読み込まれる順番」しかなかったので、
class変数に取得した値を突っ込んでいって全てが埋まったらarrayに格納という手段をとっています。
class Scraping {
private $center= "";
private $sfont1 = "";
private $sfont2 = "";
private $result = array();
private $result_date = "";
// ############ 各地区の予測を取得
public function scraping_data(tidyNode $node) {
$this->doScraping($node);
return $this->result;
}
private function doScraping(tidyNode $node) {
if(isset($node->id)) {
// $node->id が TABLEタグだったらそのなかにデータあり
if($node->id == TIDY_TAG_TD ) {
$chileNodes = $node->child ;
foreach( $chileNodes as $item ){
if(isset($item->id) && $item->id == TIDY_TAG_P ) {
if (isset($item->attribute['class'])){
// class属性値がcenterだったら
if (stristr ($item->attribute['class'] ,"center") !==FALSE){
// 区
$this->center = trim( $item->child[0]->value);
}
}
}
if( isset($item->id) && $item->id == TIDY_TAG_SPAN ) {
if (isset($item->attribute['class'])){
// class属性値がsfontだったら
if (stristr ($item->attribute['class'] ,"sfont") !==FALSE){
if( $this->sfont1 == "" ){
// 夜から朝方の予想
$this->sfont1 = trim( $item->child[0]->value );
} else {
// 日中の予想
$this->sfont2 = trim( $item->child[0]->value );
}
}
}
}
}
// 情報セットが取れたらリストに格納
if( strlen($this->center) && strlen($this->sfont1) && strlen($this->sfont2) ) {
$this->result[] = array("center" => $this->center ,"sfont1" =>$this->sfont1 , "sfont2" =>$this->sfont2 );
//echo "OK";
// クリアする
$this->center = "";
$this->sfont1 = "";
$this->sfont2 = "";
}
}
}
// 子供のノードが存在すれば、再帰的にdoScraping()を繰り返す
if($node->hasChildren()) {
foreach($node->child as $c) {
$this->doScraping($c);
}
}
}
}
おまけ(日付の取得)
このソースから日付も取り出すことにしました。
<h2>札幌市内の水道凍結予報</h2> <h3>各区の水道凍結指数</h3> <p class=comment>2009年02月24日 16時00分発表</p> <p class=clear></p>
スクレイピング処理はこんな感じになります。
class Scraping {
// ############ 日付を取得する
public function scraping_date_data(tidyNode $node) {
return $this->getDate($node);
}
private function getDate(tidyNode $node) {
if(isset($node->id)) {
// $node->id が Pタグだったらそのなかに日付データあり
if($node->id == TIDY_TAG_P ) {
// $node->id の class属性値がcenterだったら
if (stristr ($node->attribute['class'] ,"comment") !==FALSE){
return trim( $node->child[0]->value );
}
}
}
// 子供のノードが存在すれば、再帰的にdoScraping()を繰り返す
if($node->hasChildren()) {
foreach($node->child as $c) {
$result = $this->getDate($c);
if(strlen($result)) return $result;
}
}
}
}
これでスクレイピング処理が完了。
これをTwitterAPIを使用して、投稿します。
長くなったので続きは次回。
