Hatena::ブログ(Diary)

ttak100のブログ

2012-03-01

Perl Beginners #1に参加して

Perlbeginners#1で2番目にbeginner’s talkをさせていただいた@ttak100です。

まず、このような有意義な企画をしていただいた@ytnobdyさんに感謝いたします。
渋谷などでpmの集まりがあるのは知っていたのですが、ちょっと敷居が高いなぁ、と思っていたので、このイベントはまさに私のようなものにはぴったりでした。

また、私は実はこれまではTwitterblogなどは面倒で使っていなくてあまり自分から情報を発信してきていませんでしたが、Perlをより極めるにはそんなことではいけないと危機感を覚えました。ということで、twitterやこのblogも始めることにします。もうすでにイベントから4日ほどたってしまっていますが、こちらの方は本当のbeginnerなのでご容赦くださいw


Apacheの設定について

結論からいうと、まだできていません。。
http.configの入っているフォルダを丸ごと消して、再インストールしたら立ち上がったのですが、なぜかパスワードがあっていなくてログインできませんでした。そこでさらに再インストールしたら、今度はport 80が使われていてstartできないというエラーが出てしまいました。

(そこで、出張になってPCは家においてきたので、この作業は中断しています。。)

また、Apacheではなくても04 webserverとかANXXとか他にも簡単なサーバーはあるよ!とも言われましたが、私はApacheを入れたい理由があります。

それは、最近、「つくって覚えるPerl入門」という本を読んで、DBIの使い方などをソースコードを丸写ししながら勉強したいなぁ、なんて思っていたのですが、まずはXAMPPApacheが使える環境にしなくてはならなかったのです。。


WWW::Mechanizeと日本語の扱い(正規表現でマッチできない)について

ちょっと何を聞きたいのかきちんと準備できていなかったことが非常に悔やまれるのですが、それでもいくつかヒントを得れたことは収穫でした。

デコードで内部コードにして、エンコードして戻す
すみません、いろいろ忙しくてまだ試せていません。。


文字化け対策にはDamperを使う
たぶん、16進数でぞろぞろ出てくるのを見て、実際にどういう扱いになっているのか見てみるようなイメージでしょうか。。


Firefoxfirebug:要素の検証について
これが使えると、目的のフォームやボタンが簡単に分かるはずで、これの使い方をもっと詳しく聞きたかった

また、もう一度、初心に帰って(?)、Spidering Hacksを読み返してみようと思いました。


その他

・WAFのこと
ぜんぜん使おうと考えたことがなかったが、Amons2などの言葉が頻繁に飛び交っていた。
ちょっと勉強してみようと思います。

OOPのこと
「実はそこまで難しくない」という@ytnobodyさんの言葉を信じて、近い将来、挑戦してみようと思った。
データ、メソッド、クラスがキーワードで、「クッキーの金型みたい」とのこと。

・他の方のレポートを見て
Yoheiさんのレポートの真ん中あたりに貼り付けてあった、Mark ZuckerbergのDone is better than perfectがとても印象に残った(<=ぜんぜん、Perlbeginnersと関係ないじゃんw)

ということで、我ながら、かなり中途半端ではありますが、この辺で終わらせて公開してみます。。

ytnobodyytnobody 2012/03/01 14:20 >デコードで内部コードにして、エンコードして戻す
http://d.hatena.ne.jp/perlcodesample/20091118/1246679588 あたりがとても参考になります。

>文字化け対策にはDamperを使う
Dumperですね。Data::Dumperというモジュールのことを指していました。
http://d.hatena.ne.jp/minesouta/20070920/p1 が参考になると思います。

yohei-ayohei-a 2012/03/01 20:26 自分のブログのことが書かれていて驚きましたw
ありがとうございます。

Apache の件ですが、起動したらプロセスが起動しているかタスクマネージャーなどで確認すると良いかもしれません。起動している場合は、ポートが開いているかを netstat や telnet(ポート指定で) コマンドで確認すると良いかもしれません。もし、他のプロセスとポートがバッティングしている場合は、Apache のポートを変更するか、バッティングしているアプリケーションを停止する、またはポート番号を変更するなどするとできるのではないかと思いました。

↓あと、参考なるかどうかわかりませんが、昔、WWW::Mechanize を使ってみたときのメモです。
http://d.hatena.ne.jp/yohei-a/20100319/1269001560

ttak100ttak100 2012/03/02 01:30 ytnobodyさん
ありがとうございます。

decode/encodeやっているのですが、なかなかうまくいきません。
それは、たぶん、プログラムで扱っているデータがどの文字コードなのかきちんと把握できていないためで、そのためにDumper。。おっとスペルミス。。を使うのかと思っていましたが、そうじゃないようですね。。

ちょっと、引き続きいろいろやってみます。

yohei-aさん

こちらこそ、いろいろと参考にさせていただきます。

Apacheは、netstatでみてみると、なんか停止してはいけなそうなプロセスとバッティングしていたので、Apacheのポートを変更してみようと思います。。

WWW::Mechanizeのエントリーも拝見しましたが、ちょっと難しいですw
でも、Web::Scraperとの使い分けが今後は課題かと思っています。
CSVに出すのも、いつかはやってみたいです。
今は手動でやっています。。printで出したのをWORDやEXCELで置換したりして。。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

トラックバック - http://d.hatena.ne.jp/ttak100/20120301/1330577010