takminの書きっぱなし備忘録 このページをアンテナに追加 RSSフィード Twitter

2018-06-01

フリーランスエンジニアから法人成りしました

| 11:44 | フリーランスエンジニアから法人成りしましたを含むブックマーク フリーランスエンジニアから法人成りしましたのブックマークコメント

2009年の5月1日から9年間個人事業主として活動してきましたが、2018年5月11日に法人化したので、知り合いへの報告と、同じように法人化を検討している自営業の方の参考になるかもしれないので、経緯をまとめておきます。


もともと個人事業主になった経緯は、前職のベンチャーをやめた時まだ社会人博士課程在学中で、二足の草鞋状態で雇ってくれるところもないだろうということで、とりあえず独立しました。

もう一つ、それまでリストラ2回とブラック会社勤務を経験し、年齢的にも転職が厳しくなると言われている三十路中盤だったため、今後サラリーマンを続けていくことに不安を感じていました。そこで、とりあえず自分の名前で仕事取ってこれるようになれば、リストラブラック会社怖くないだろうというのも理由です。


独立直後は赤字案件に捕まって生活が追い込まれたりもしましたが、なんとか博士号も取得し、お客さんにも恵まれてこれまでやってこれました。


尚、自分の仕事内容について簡単に説明すると、独立する前からコンピュータビジョンという人工知能の画像分野に関わってきました。独立前は他の大学や他の企業が開発したコンピュータビジョンアルゴリズムを元にアプリやサービスを開発するようなことをずっとやってきましたが、独立後はコンピュータビジョンアルゴリズムを中心に受託で研究したり開発したりコンサルしたりといったことをやってきました。


ここら辺の経緯は以下の記事にまとまってます。


「働きながら7年間かけて博士号を取得しました」

http://d.hatena.ne.jp/takmin/20140329/1396087917


コンピュータビジョン先端技術で未来を見据える VISION&IT Lab 代表 Dr. 皆川卓也」

https://the-stage.tech/articles/20170613-minagawa.html


余談ですが、自分が博士課程に進学した2007年はAIブームよりも前で、博士課程後はブルーオーシャンを悠々泳いでいくつもりだったのですが、博士号取得にモタモタしている間に2012年にDeep Learningブームが起こり、取得したころにはすっかりレッドオーシャンになっていました。もっともAIブームのお陰で独立しても食うに困らなかったということもあるのですが。


独立後の仕事は知り合いからの紹介や、このブログSlide Sharegithubなんかを見て連絡を下さった方、僕が主催している「コンピュータビジョン勉強会@関東」の参加者などから頂いてきました。なので、基本営業らしい営業はしてません。


また、いわゆる常駐のようなことはせず、事前に作業の進め方や作業範囲/ゴール等を提案書の中で合意して進めるやり方をしてきました。そのため時間は自由に使えて、子供が産まれたばかりの頃などはとても助かりました。平日に混雑を避けてレジャーにいけるのもメリットです。


ちなみにランサーズやクラウドワークスを利用したことはありませんが、独立したばかりで仕事の伝手がない人が最初に利用するのには良いのかなという気がしています。

ただ、ああいうところから流れてくる仕事は、既にやることが定義されてしまっているため価格競争に陥りやすく、あまり儲からないだろうと思ってます。それよりもお客さんの要望がまだとモヤっしている段階から自分で提案していった方が、より良いやり方を考えられるし、作業内容も価格もある程度こちらでコントロールできるので自分はこちらが好みです。


というわけで、それなりにフリーランスとして充実してましたが、1つ大きな不満は


寂しい


ということです。例えば、仕事に関して悩んだときに気軽に話を聞いてくれる人がいません。これは、例えばバグが取れない、というような技術的に詰まった状態に限らず、見積もり金額など何か決断を下さなければならない時に、外部から冷静に意見を言ってくれる人がいない、という辛みもあります。

また勉強会や外部の人に聞くなどで、自分の専門分野に関しては色々と情報も入ってくるし、仕事を通して成長の機会もあるのですが、専門外の話や自分が意識的に収集した情報以外についてはほとんど話が入ってこないため、自分自身の視野が狭まっていっていると感じていました。

企業に勤めていたときは、そういう情報が同僚などから自然と耳に入りましたし、みんなで一つの目標に取り組む喜びみたいなのがありましたが、そういうのがないのも寂しいです。

最近、在宅勤務を見直す風潮がありますが、非常にわかる気がします。


というわけで、子供が幼稚園に入園して今までよりも時間に余裕ができそう(+平日レジャーもやりにくくなる)ということもあって、法人化を検討していました。単に寂しいだけならどこかに就職するという手もありますが、そうなると一旦私の抱えているお客さんとの関係を切らなくてはいけなくなり、またリストラされた時のことを考えると大変リスキーです。

とはいえ、この分野の人材は引く手あまたなので、法人化してもすぐ人が雇えるとは思えないし、何人か共同創業者に誘ってみましたが良い返事が貰えず、ただ法人化しても当初の目的が果たせそうにありません。


そこでふと事業売却という形を思いつきました。つまりどこか私の事業ごと買ってくれる会社があれば、お客さんとの関係を切らずに済むし、人と一緒に仕事もできます。

というわけで、いくつかの会社と話をしてみたのですが、その中の一社が「株式会社フューチャースタンダード」でした。


フューチャースタンダードはSCORERというカメラ映像に対するストレージ+画像解析のプラットフォームを扱っている会社で、私も技術顧問をさせていただいてました。SCORERは様々な大学や企業が提供しているコンピュータビジョンアルゴリズムを機材を設置するだけで手軽に使えるようになっており、そのために必要なカメラやセンサー、通信クラウド、Edgeコンピューティングなどの周辺技術をEnd-to-Endでサポートしています。

私もコンピュータビジョンアルゴリズムを提供するうちの一社としてソフトウェアを提供したり、技術相談などに乗ってきました。


いくつかお話しさせていただいた会社の中でフューチャースタンダードが一番、連携した時にお互いメリットがあるんじゃないかと思ったのですが、先方もベンチャー企業で買収にほいほいお金を出せるわけではないですし、考えてみたら事業売却という形じゃなくて事業提携という形にすればこちらの目的は十分果たせる上に、独立性も保てるということに気付きました。

そこで、新法人をフューチャースタンダードのオフィス内に設置させていただき、営業や技術、人材交流の面で密に連携するような業務提携契約を結びました。


フューチャースタンダード代表取締役鳥海さんはビジネス、ファイナンス、技術など広範囲にわたって色々な知識と経験を持っている方で、他のメンバーも様々な分野のスペシャリストがそろっているため、こちらも日々良い刺激が受けられそうです。


この提携により、今後は既存の技術をうまく流用することで、自分の時間をより困難な技術課題に注力しつつ、今までのアルゴリズム中心の研究や開発以外にも、アプリ/システム/ソリューション提供などにも範囲を広げていきたいと思ってます。


というわけで、今まで「ビジョン&ITラボ」という屋号で活動してきましたが「株式会社ビジョン&ITラボ」を設立することになりました。

http://visitlab.jp (すいません、HPアップデートはまだできていません)


人も増やしていければなあと思っているので、興味ある方はご連絡ください。

今後とも宜しくお願い致します。

2018-05-27

第一回 3D勉強会発表資料「ORB-SLAM Code Reading」

| 23:54 | 第一回 3D勉強会発表資料「ORB-SLAM Code Reading」を含むブックマーク 第一回 3D勉強会発表資料「ORB-SLAM Code Reading」のブックマークコメント

今回、産総研AIセンターの櫻田先生が主催する第一回3D勉強会@関東で発表してきました。


第一回3D勉強会@関東「SLAMチュートリアル大会」

https://3dvision.connpass.com/event/86945/


ツイートまとめ

https://togetter.com/li/1231482


三次元ビジョンはコンピュータビジョン勉強会でもたまに扱うテーマですが、この勉強会はより三次元処理を中心に据えた勉強会で、認識だけでなくCGのような表現までカバーする予定だそうです。


私は「第一AI Code Review」でORB-SLAMというARなどで利用される技術について簡単なコード解説をしましたが、今回は三次元ガチ勢も多いと思うので、より突っ込んだ解説をしています。


また、今回は事前にsyinari0123さんの「論文紹介:ORB-SLAM」があったので、ORB-SLAM自体のアルゴリズムの解説は割愛し、実装の中身を中心に解説しています。


論文紹介:ORB-SLAM

https://www.slideshare.net/MasayaKaneko/slamorbslam



私の資料はこちら

ORB-SLAM Code Reading」

2018-04-25

ORB-SLAM2コードリーディング

| 17:42 | ORB-SLAM2コードリーディングを含むブックマーク ORB-SLAM2コードリーディングのブックマークコメント

昨日こちらの「第一AI Code Review」というイベントで発表してきました。

https://aich.connpass.com/event/83405/


発表を打診された時、ちょっと表に出せるような機械学習系のコードを書いておらず、一度断りました。ただ仕事で取り組んでいるORB-SLAM2のコードレビューでも構わないということで、こちらの勉強会の趣旨に反して、AIでもなければ自分で書いたコードでもないけど、参考になればと思い発表しました。


基本は以下で発表した資料が基になってます。

http://d.hatena.ne.jp/takmin/20170613/1497334760


今回、参加者が機械学習系の人たちで、三次元画像処理は初心者だろうという想定で、原理の説明にやや時間を使って、コードの解説は全体の構成を説明するにとどめました。

来月あたり、別の勉強会でもっとコードの詳細に突っ込んだ話をする予定です。

2018-04-21

2018/04/21 CV勉強会「CVでこんなもの作りました大LT大会3」発表資料まとめ

| 00:37 | 2018/04/21 CV勉強会「CVでこんなもの作りました大LT大会3」発表資料まとめを含むブックマーク 2018/04/21 CV勉強会「CVでこんなもの作りました大LT大会3」発表資料まとめのブックマークコメント

第45回コンピュータビジョン勉強会@関東は、「コンピュータビジョンでこんなプログラム作りました大LT大会3」というテーマで、株式会社サイバーエージェント様の会場をお借りして行いました。


例によって発表資料をまとめます。



コンピュータビジョン勉強会@関東

http://sites.google.com/site/cvsaisentan/


開催プログラム

https://kantocv.connpass.com/event/81006/


Tweetまとめ

https://togetter.com/li/1220201


今回は、今までUstreamで行っていた配信Youtubeに変えました。

まだ扱いが不慣れなため、配信を停止するたびにURLが変更になり、視聴していた方にはご不便おかけしました。

以下で録画を確認できます。

https://youtu.be/AuHmjI8GrLY

https://youtu.be/FN-uiJmp1LQ

https://youtu.be/WrFlfZ9W8ro

https://youtu.be/2N_XWnpnCpA


取り急ぎ、発表者ごとに資料のリンクをまとめます。(敬称略)


発表者: Kazuhiro Ota

内容: CycleGANで画像変換


発表者: sumisumith

内容: ROSの話

https://www.slideshare.net/sumisumith/20180421cvlt


発表者: lunardog

内容:料理検出と実装

http://techlife.cookpad.com/entry/2018/04/06/124455


発表者: marsee101

内容:FPGAで白線検出してミニカーを走らせる

https://www.slideshare.net/marsee101/fpga-robot-car


発表者: xchiex17

内容: Androidで3Dポーズ推定

https://niconare.nicovideo.jp/watch/kn3002


発表者: Yusuke Suzuki

内容: TensorFlowで遊んだ話

https://drive.google.com/file/d/1T6FgxbUyeNxPar0AIKEjvNgttQAwe63_/view?ts=5adaed9b


発表者: satoshi_toriumi

内容: 画像解析プラットフォームScorerの紹介


発表者: yuyu2172

内容: ChainerCVの紹介

https://www.slideshare.net/YusukeNiitani1/45-chainercv


発表者: えすじ

内容:4コマ漫画のコマ切り出し

https://slideship.com/users/@esuji/presentations/2018/04/9EL6HYZ9jsGb9Qngj9ZYhH/


発表者: tkato_

内容: Depth画像からポーズ推定(脱Kinect

https://www.slideshare.net/tetsurokato/depth-image-keypoint-detection


発表者: dandelion1124

内容: VisionWorks Tips

https://www.slideshare.net/YasuhiroYoshimura/45nvidia-visionworks-tips


発表者: ミクミンP

内容: アノテーションツールを自作した話

https://www.slideshare.net/ksasao/ss-94564856


発表者: Shun Hasegawa

内容: HoloLensでDiminished Reality

https://drive.google.com/file/d/10eFfJoCBjmyLFT6uQ67kyH1dv2DJiUfG/view?ts=5ad98b82


発表者: kazunari takeichi

内容:足のサイズ測定とランニング解析


発表者: いしたー

内容:SSDで道路の傷検出

https://qiita.com/IshitaTakeshi/items/915de731d8081e711ae5


発表者: tomoaki_teshima

内容: モバイル上でOpenCL

https://www.slideshare.net/tomoaki0705/cvim-saisentangpuopen-cl


今回はLTで発表者が多いので、リンクまとめるだけでも一仕事。。。

2018-03-19

学習画像/動画作成用アノテーションツールを調べてみた

| 14:22 | 学習画像/動画作成用アノテーションツールを調べてみたを含むブックマーク 学習画像/動画作成用アノテーションツールを調べてみたのブックマークコメント

アノテーションツールは画像を使った機械学習タスクで、画像に教師ラベルを付与するためのGUIツールです。

昔、物体検出用のアノテーションツールとしてこんなの作りましたが、今はもっと良いものが色々とあるみたいなので、調べてみて良さそうだったものをいくつかピックアップしました。

ちなみに調べただけで、imglab以外はまだ使ってません。

アノテーションツールのリストはここが参考になります。

https://en.wikipedia.org/wiki/List_of_manual_image_annotation_tools


オンラインツール

LabelBox

LabelBoxはオンラインで使用可能なアノテーションツールで、年5000ラベルまで無料で使えます。画像データをLobelBox上のサーバーへアップするか、もしくはAWS上の自社データに対して使用することが可能です。物体検出用のBounding Boxだけでなく、Semantic Segmentationで使用可能なPolygon、姿勢推定に使用できるPointなどもサポートしています。

また出力フォーマットもCSVJSONの他、Pascal VOCやCOCOなどのデータセットに準拠した形式でも出力可能です。

https://www.labelbox.io/


Image Annotation Programme

Webブラウザから使用できるアノテーションツールで、MITライセンスによりコードが公開されています。Pascal VOCフォーマットでBounding Boxを出力します。

https://github.com/frederictost/images_annotation_programme


LabelMe

MITで開発されたSemantic Segmentationに使用可能なアノテーションツールです。サーバー上にインストールすることで、Webブラウザ上からアノテーション可能です。

http://labelme.csail.mit.edu


VATIC

ブラウザから動画のアノテーションが行えるツールです。コードをダウンロードし、自ら立ち上げたサーバー上で運用する必要があります(MITライセンス)。

動画のフレームに対しBounding Boxを設定し、そこに物体名の他、Actionなどをラベル付けできます。数フレームおきにアノテーションをした際、その間を自動補間する機能があります。

http://carlvondrick.com/vatic/

尚、上記プロジェクトページからだとコードへのリンクがわかりづらいので、こちらにも張っておきます。

https://github.com/cvondrick/vatic

D



オフラインツール


LEAR Image Annotation Tool

Semantic Segmentation用のラベルを作成するためのツールです。C++Qtライブラリを用いて開発されており、GPLライセンスです。

https://lear.inrialpes.fr/people/klaeser/software_image_annotation


imglab

imglabはdlib(http://dlib.net/)というC/C++ベースのコンピュータビジョンライブラリに同梱されている画像アノテーションツールです。(Boost Software License)

物体検出用のBounding Boxおよび、姿勢推定等に使用可能な特徴点をプロット可能です。

https://github.com/davisking/dlib/tree/master/tools/imglab

f:id:takmin:20180319141541p:image


アウトソース

このようにツールを使って自分たちでアノテーションをかける以外にアウトソースすることも考えられます。


機械学習ディープラーニング用正解データセット作成支援

グローバルウォーカー株式会社では、機械学習用のデータセット作成サービスを請け負っています。画像自体の作成から、アノテーションツールの作成、アノテーション作業まで依頼することが可能です。

http://www.globalwalkers.co.jp/service/servicemovie/


Amazon Mechanical Turk

Amazonが提供するクラウドソーシングサービスです。多くの研究者がデータ作成に利用した実績があります。

https://aws.amazon.com/jp/mturk/


まとめ

人工知能ブームのおかげで、これからもこの手の便利なツールは増えていくと思われます。

自分でツール作る前にこの辺の利用できるものは積極的に利用した方が良さそうですね。