takminの書きっぱなし備忘録 @はてなブログ

主にコンピュータビジョンなど技術について、たまに自分自身のことや思いついたことなど

第12回全日本コンピュータビジョン勉強会「データセット関連読み会」資料まとめ

本日第12回全日本コンピュータビジョン勉強会(JapanCV)を「データセット関連読み会」をPRMU/IBISML/CVIM研究会との共催で広島大学東広島キャンパスにてハイブリッド開催いたしました。

以下、例によって資料やリンク等のまとめておきます。

登録サイト

kantocv.connpass.com

Togetter

togetter.com

YouTube

youtube.com

PRMU/IBISML/CVIM研究会開催プログラム

ken.ieice.org

コンピュータビジョン勉強会@関東

sites.google.com

資料まとめ

発表者 発表内容 資料
takmin Machine Learning Operations (MLOps): Overview, Definition, and Architecture https://speakerdeck.com/takmin/di-12hui-japancvfa-biao-zi-liao-machine-learning-operations-mlops-overview-definition-and-architecture
kzykmyzw "Segment Anything","Recognize Anything: A Strong Image Tagging Model","Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data","The All-Seeing Project: Towards Panoptic Visual Recognition and Understanding of the Open World"のデータセット構築解説 https://speakerdeck.com/kzykmyzw/x-anything-detanoguan-dian-kara
ryo-nakamura Pre-training Vision Transformers with Very Limited Synthesized Images
alfredplpl 画像/動画データセットの紹介と作り方(LAION-5B、CommonCanvas、DALL-E 3、Sora、Lumiere、Genie、Panda-70M) https://www.docswell.com/s/alfredplpl/KEN3MQ-2024-03-03-170253
ttyszk Full or Weak annotations? An adaptive strategy for budget-constrained annotation campaigns https://speakerdeck.com/x_ttyszk/di-12hui-japancvfa-biao-zi-liao-full-or-weak-annotations-an-adaptive-strategy-for-budget-constrained-annotation-campaigns
caprest 車載データセット構築におけるレアケースマイニング https://docs.google.com/presentation/d/1b4JzUrE1Dr5l03BWbXNbZo5jTuNQnYbcdz4yfxLyd-Y/
nao_okamo Learning Transferable Visual Models From Natural Language Supervision (ICML2021)
DINOv2: Learning Robust Visual Features without Supervision (arXiv2023)
The Effectiveness of MAE Pre-Pretraining for Billion-Scale Pretraining (ICCV2023)
https://speakerdeck.com/naok615/di-12hui-quan-ri-ben-konpiyutabiziyonmian-qiang-hui-hua-xiang-nozi-ji-jiao-shi-arixue-xi-niokeruda-gui-mo-detasetuto

私の発表資料

"Machine Learning Operations (MLOps): Overview, Definition, and Architecture"を読みました

speakerdeck.com

2023年の振り返りと2024年の抱負

新年あけましておめでとうございます。

昨年の振り返りをまとめていたら年が明けてしまいました。

多分、ブログで1年を振り返る、なんて記事を書くのは今回が初めてですが、2024年は色々と踏ん張らなくてはいけない年になりそうなので、整理のためにまとめておきます。

2023年の振り返り

コンピュータビジョン勉強会

コロナ禍後、2022年10月に久しぶりのオンサイト(ハイブリッド)開催をPRMU研究会との共催で行いましたが、それ以降2023年になってもオンサイトで3回(前後編も合わせると4回)の勉強会を開催することができました。

第58回コンピュータビジョン勉強会@関東「深層学習+3D論文読み会」資料まとめ - takminの書きっぱなし備忘録 @はてなブログ

第59回コンピュータビジョン勉強会@関東「CVPR2023読み会(前編)」 - takminの書きっぱなし備忘録 @はてなブログ

第59回コンピュータビジョン勉強会@関東「CVPR2023読み会(後編)」 - takminの書きっぱなし備忘録 @はてなブログ

第60回コンピュータビジョン勉強会@関東「ICCV2023読み会」 - takminの書きっぱなし備忘録 @はてなブログ

色々なところで話しているとおり僕が勉強会を続けているのは、とにかく自分が勉強したいからです。なので毎回発表者になるつもりではいるのですが、一応幹事なので発表者が十分にいる場合は他に譲るようにして、自分は運営に集中するようにしています。

嬉しいことに毎回多くの発表者が集まってくれるので、2023年の発表はCVPR2023読み会(前編)の1回きりでした。

MobileNeRF(第59回CV勉強会@関東発表資料) - Speaker Deck

ただ、「深層学習+3D論文読み会」の時は、テーマ的にとても発表したかったので、後日資料だけ作ってこのブログにアップしました。

点群SegmentationのためのTransformerサーベイ - takminの書きっぱなし備忘録 @はてなブログ

それと、やはりオンサイト開催となったことで、懇親会が復活したのはとても嬉しいです。参加者の皆さんから色々な話を聞くのは勉強会のもう一つの楽しみなので。

気付くともう60回やってるんですね。コロナ禍はJapanCVとして名古屋、関西と合同でオンラインで開催していたので、それもカウントすると70回に達します。

ここまで続けてこれたのは、幹事の皆さんや発表者/参加者の皆さん、会場を提供していただいた企業/大学の皆様のお陰です。

次回はJapanCVとして名古屋、関西の勉強会と合同で広島で行う予定です。

お仕事のこと

2023年の仕事で一番大きな出来事は「妖怪ハンター候補生」というARゲームのテストプレイを綱島公園で開催したことです。

AR探索アドベンチャー「妖怪ハンター候補生」 - takminの書きっぱなし備忘録 @はてなブログ

また、このゲームのことを横浜日吉新聞様に取材していただきました。

綱島公園で「妖怪ハンター」ゲーム、慶應理工で学んだ起業家がチャレンジ呼び掛け | 横浜日吉新聞

多少のトラブルはあったものの、お陰様で参加者の皆さんからは好評をいただき、手ごたえをつかむことができました。

期間中毎日綱島公園に通ってユーザの様子を見ていたのですが、子供たちが喜んでくれているのが一番の励みになりました。

このテストプレイにこぎつけるまでには実は色々な紆余曲折がありまして、とても学びの多い1年でした。

もともとサーバーサイドとWebクライアントは外注する予定だったのですが、外注先が納期を遅れに遅れた後、まったく連絡が取れなくなり、手付金を丸損した上に一から自分で開発する羽目になりました。おかげで当初は3月上旬に完成予定だったシステムが、大幅に遅れてしまいました。

私がWeb系の技術開発していたのは15年近く昔のことなのですっかりその当時とは技術も変わってしまい、開発には四苦八苦しましたが、ChatGPTの助けもあってどうにか形にすることができました。

その時にはまったWebフロントの問題が以下の記事です。

javascriptでカメラの解像度を取得するとOSやブラウザで振る舞いが異なる - takminの書きっぱなし備忘録 @はてなブログ

大変でしたが、お陰様で自分が納得いくものが作れましたし、フルスタックエンジニアにもなれました(笑)

他にも特許の取得や、ゲームというB2Cサービスの開発過程、知名度のない零細企業が地元の協力を取り付ける困難さ、社会の闇など、このサービス開発を通じて多くの学びを得ることができました。

2024年の抱負

ARゲームについては、引き続きまずは実績を積み重ねていくことと、黒字化を目指してTry&Errorをしながら、機能追加をしていきたいと思います。 こういったゲームに興味のあるイベント会社、商店街、観光地、テーマパーク等はぜひお問合せ下さい。

www.overlay-world.com

また引き続きコンピュータビジョンに関するコンサルティングや研究、開発、プロジェクトマネジメントなどの受託も続けていきます。 せっかくARゲームの開発でサーバーサイドからクライアントサイドまで一通り経験したので、それらも含めたトータルソリューション開発やプロジェクトマネジメントなどにも、より力を入れていこうと思っています。お仕事の依頼はこちらまで

もちろんコンピュータビジョンについても引き続きスキルアップを続けていきます。勉強会だけでなくこのブログでも学んだことをアウトプットしていければと思います。今年は論文の紹介だけでなく、もう少し実装寄りの話もアップしていきたいと思ってます。

それでは本年もよろしくお願いいたします。

第60回コンピュータビジョン勉強会@関東「ICCV2023読み会」

本日コンピュータビジョン勉強会@関東「ICCV2023読み会」をSansan株式会社様の会場をお借りして開催いたしました。

以下、例によって資料やリンク等のまとめておきます。

登録サイト

kantocv.connpass.com

Togetter

togetter.com

Youtube

youtube.com

コンピュータビジョン勉強会@関東

sites.google.com

資料まとめ

発表者 発表内容 資料
tomoaki_teshima LightGlue: Local Feature Matching at Light Speed https://t.co/Gp0lvoChZ1
colum2131 Unsupervised 3D Perception with 2D Vision-Language Distillation for Autonomous Driving https://t.co/luZzxlJu36
Quintessence SoDaCam: Software-defined Cameras via Single-Photon Imaging
s_aiueo32 Revisiting Scene Text Recognition: A Data Perspective https://t.co/dcI2vBtgO8
abemii_ VAD: Vectorized Scene Representation for Efficient Autonomous Driving https://t.co/hWEVpEtNly
shade-tree ITI-GEN: Inclusive Text-to-Image Generation
Kaito Imai Iterative prompt learning for unsupervised backlit image enhancement
yu-ya4 DocTr: Document Transformer for Structured Information Extraction in Documents https://t.co/Jx83CqXeZV
tana MotionLM: Multi-Agent Motion Forecasting as Language Modeling https://t.co/NnOsb9enwP

今回はハイブリッド開催でしたが、皆さんのご協力でスムーズに運営出来ました。 どうもありがとうございました。

AR探索アドベンチャー「妖怪ハンター候補生」

11月23-26日の4日間、横浜市綱島公園というところで、弊社の新サービス「妖怪ハンター候補生」のテストプレイを行います。

綱島公園イベントチラシ

これは、ARを使ったストーリー性のある探索ゲームになっています。

スマートフォンがあればアプリインストールせずにすぐ始められます。参加無料ですので、お近くにお住まいの方はぜひ遊んでみてください。

まだサイトは作ってないのですが、取り急ぎ上記チラシのPDFはこちらからダウンロードできます。 https://visitlab.jp/hunter

元々は、デジタルツイン管理ミドルウェア「シナリオエンジン」というのを開発して特許を取り、これをどうビジネスにするかというところからサービス開発が始まりました。

はじめはスマートファクトリやスマートビルディングなどの用途を考えていたのですが、自分の子供が謎解きにはまり、一緒に色々なイベントへ行くうちに、このミドルウェアをゲームに応用して子供に喜んでもらいたいと思うようになりました。

というわけで、大人だけでなく親子でも楽しめる内容にしたいと思っています。今後、このゲームプラットフォームを育てて行きたいと思ってますので、ぜひ一人でも多くの方に遊んでいただき、ゲームの最後に用意するアンケートに感想を記入していただければと思います。