zaknakの日記 RSSフィード

2010-03-17

[]pixiv用extractor

11/7/13 追記

メンテしてないし低機能なので、pixivからブックマークと同時にPOSTできるTomblooパッチがサムネイル対応 | 圧縮電子精神音楽浮遊構造体を利用されることをおすすめします。追記終わり。



こちらにヒントを得て書いてみました。http://tumblr.g.hatena.ne.jp/retlet/20100311/1268287533

サムネイル上で実行してもリンク先を取得してタイトルとか設定するようにしてあります。で、実行にあたってリファラの制御が必要になると思うので、その辺はアドオン等で各自適当に。何かその時々でアクセス制御の挙動が変わってよくわからないので。

Tombloo.Service.extractors.register([
{
	name : 'Photo - pxiv',
	ICON : 'http://www.pixiv.net/favicon.ico',
	check : function(ctx){
		return ctx.onImage && ctx.target.src.match(/^http:\/\/img\d.+?\.pixiv\.net\/img\//) && ctx.onLink;
	},
	extract : function(ctx){
		var hostURL = 'http://www.pixiv.net/';
		var illustURL = /^http:\/\/www\.pixiv\.net\/member_illust.php\?mode=/;
		var mangaURL =  /^http:\/\/www\.pixiv\.net\/member_illust.php\?mode=manga/;

		if(!ctx.href.match(illustURL)){
		//実行元がイラストページではなかった場合、リンク先のイラストページを取得して足りない情報を得る
			var deferred = request(ctx.link.href).addCallback(function(res){
				var responseHTML = convertToHTMLDocument(res.responseText);
			//実行元タイトルをイラストページのタイトルに入れ替え
				ctx.title = $x('//title/text()', responseHTML);
			//イラストに設定されたリンクを取得
				var linkHREF = $x("id('tag_area')/following-sibling::*/a[contains(@href,'mode=')]/@href",responseHTML);
			//実行元アドレスをイラストページのアドレスに入れ替え
				ctx.href = ctx.link.href;
			//相対アドレスが取得されていた場合、ホスト部を補間
				if(!linkHREF.match(/^http:\/\//)) linkHREF = hostURL + linkHREF;
			//イラストに設定されたリンクのアドレスを返す
				return linkHREF;
			});
		}else{
		//実行元がイラストページだった場合、必要な情報は得られるのでリンク先から取得する必要は無い
		//succeedは成功したdeferredが返る。設定した引数はcallbackの引数になる。
		//すでに必要な値が揃ってる場合と、requestして情報を取ってこなきゃいけない場合が同じように書ける。
			var deferred = succeed(ctx.link.href);
		}

		return deferred.addCallback(function(linkHREF){
			if(linkHREF.match(mangaURL)){
			//マンガ形式だった場合、1枚目の画像を設定
				var itemUrl = ctx.target.src.replace(/_(?:m|s|100)\.([^.]+)$/,'_p0.$1');
			}else{
				var itemUrl = ctx.target.src.replace(/_(?:m|s|100)\.([^.]+)$/,'.$1');
			}

			return download(itemUrl, getTempDir(), false).addCallback(function(file){
					return {
						type	: 'photo',
						item	: ctx.title,
						itemUrl : itemUrl,
						file	: file,
					}
			});
		});
	}
}
],'Photo');

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

トラックバック - http://d.hatena.ne.jp/zaknak/20100317/1268905782
Connection: close