2012-04-12
2-gramのコード
日頃から書いてないと忘れる。
list.count('a')でリストlist=['a','b','a',...]内のaの数を数える。
重複の削除はif not文をうまく活用する。
#! /usr/bin/env python # -*- coding: utf-8 -*- import re sent = u"日本語で書いた日本語の文を解析します。" arr=[] for i in range(len(sent)-1): arr.append(sent[i]+sent[i+1]) comb = [(a,arr.count(a)) for a in arr] rmv = [] for c in comb: if not c in rmv: rmv.append(c) #重複を削除(if notを使うのがミソ) for r in rmv: print r[0],r[1]
sorted()でソート機能つけた。
あと、ファイル読み込みも。
#! /usr/bin/env python # -*- coding: utf-8 -*- import re import codecs filename = raw_input("input the file name:") fin = codecs.open(filename,"r","utf-8") fout = codecs.open("out.txt","w","utf-8") #sent = u"日本語で書いた日本語の文を解析します。" arr = [] for line in fin: for i in range(len(line)-1): arr.append(line[i]+line[i+1]) comb = [(a,arr.count(a)) for a in arr] rmv = [] for c in comb: if not c in rmv: rmv.append(c) #重複を削除(if notを使うのがミソ) rmv = sorted(rmv,key=lambda x:int(x[1]),reverse=True) for r in rmv: print r[0],r[1] fout.write(r[0]+str(r[1])+"\n") fin.close() fout.close()
トラックバック - http://d.hatena.ne.jp/seinzumtode/20120412/1334237551
リンク元
- 3 http://pipes.yahoo.com/pipes/pipe.info?_id=04913f684f1141e0b48179f97811ce12
- 2 http://code-life.net/?p=1600
- 2 http://reader.livedoor.com/reader/
- 2 http://www.google.co.jp/url?sa=t&rct=j&q=カルマンフィルタ実装&source=web&cd=2&ved=0CDwQFjAB&url=http://d.hatena.ne.jp/seinzumtode/20111220/1324393685&ei=cYGHT-H1N9DnrAfS36Sp
- 2 http://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&cd=1&ved=0CCYQFjAA&url=http://d.hatena.ne.jp/seinzumtode/20111111/1320990060&ei=_8WGT8LEJ6vimAXb7vDIBw&usg=AFQjCNGbbXwuNo8EmgWzZ2IZSBXgJ277Ug&sig2=vBXqW2u5DWkuewuILxcDuw
- 2 http://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&ved=0CC8QFjAB&url=http://d.hatena.ne.jp/seinzumtode/20110817/1313547548&ei=qcOGT92ZJeOfmQXRm9XRBw&usg=AFQjCNFeORfwfjTWGQYYOMUkGkEsogkAfQ&sig2=D0JkacYCTyLFUWWn4Wp4vw
- 2 http://www.google.co.jp/url?sa=t&rct=j&q=warning: you are not allowed to write into directory &source=web&cd=2&ved=0CC0QFjAB&url=http://d.hatena.ne.jp/seinzumtode/20120113/1326454876&ei=heOGT_PGHrGuiQeytMmwBw&usg=AFQjCNG
- 1 http://docomo.ne.jp/cp/as-rslt.cgi?pno=2&key=電子工作整流&fid=6
- 1 http://k.hatena.ne.jp/keywordblog/Rails
- 1 http://oku.edu.mie-u.ac.jp/~okumura/texwiki/?Mac

