AI/MLエンジニア(Vision Language Model・動画認識)の経験者を募集します!
【会社概要】
株式会社Ollo(オロ)は、2019年に東京大学 松尾研究室のメンバーを中心に設立された、製造業向けAIスタートアップです。
「ものづくりの仕事を、ワクワクで溢れさせる」をミッションに掲げ、作業分析AIソフトウェア「Ollo Factory」を開発・提供しています。
代表の川合は松尾研究室出身のエンジニアであり、いまもコードを書き続けています。
Ollo Factoryは、日産自動車・スズキをはじめとする国内最大手自動車メーカーに採用され、現在では世界30ヶ国・5,000現場以上で利用されるグローバルプロダクトへと成長しています。
【募集背景】
当社のコア技術である動画認識AIは、世界中の製造現場で日々膨大な作業映像を解析しています。このポジションでは、動画認識モデル(Vision Language Model、VLM)の開発・改善を中心に担っていただきます。
具体的には、以下のような方向でモデルを進化させていきます。
モデルの精度や実行スピードの向上
動画を対象としたRAG(Video RAG)による現場ナレッジの検索・活用
エッジデバイス上での大規模モデルの実行
製造ラインでのリアルタイム推論
研究と実装の両面で取り組むべきテーマが多く、中心メンバーとして関わっていただけるポジションです。
【業務内容】
・製造現場の作業動画を解析するVision Language Modelの研究開発・改善
・行動認識・姿勢推定・物体検出など、Computer Vision領域のモデル設計・学習・評価
・多様な現場環境(照明・カメラ角度・作業内容)に対応するロバスト性の向上
・エッジデバイス上での大規模モデルの最適化・デプロイ
・製造ラインにおけるリアルタイム推論パイプラインの構築
・モデルの量子化・蒸留・プルーニングによる軽量化
【開発環境】
・Webフロントエンド: TypeScript, Vue, Nuxt.js
・バックエンド: Go, GraphQL, Python(FastAPI)
・デザイン: figma
・データベース: MySQL
・コミュニケーションツール: Slack
・ドキュメント管理: Notion
・コード管理: GitHub
・laC: Terraform
・インフラ: AWS
・IDE: vscode
・CI/CD: GitHub Actions
・コーディング支援: Github Copilot
【エンジニアチーム】
アルゴリズム開発:5名
Webアプリ開発:5名
インフラ:1名
【仕事の魅力】
・少数精鋭のチームで、立ち上がったばかりのサービス開発をするため、一人当たりの裁量や権限が大きい
・立場や役職に関係なく議論ができるフラットな社風のため、自身の考えや意見を主体的に提案することができる
・弊社プロダクトは大手企業への導入実績があり、今後のさらなる拡大フェーズを体験でき、同時にスタートアップの組織拡大フェーズのコアメンバーとして活躍できる
・エンジニアが、プロダクトが導入される工場に訪問する機会があるため、開発しているプロダクトがどのように使われ評価されているのかを自分の目で確かめられ、機能のアップデートや改善に直接繋げられる
・東大出身のAI技術者が会社のほとんどを占めており、AI技術についてハイレベルに学べる環境がある
・経験豊かな経営陣、ビジネスメンバーが多数在籍しているため、安定した取り組みが可能
・日々の業務においては、エンジニアサイド・ビジネスサイド双方から質問/提案/顧客要望などがあればすぐコミュニケーションをとって解決を目指しているため、プロダクトグロースに関心が高いエンジニアにとってスムーズに業務推進ができる環境がある
・エンジニアチームは平均年齢28歳のメンバーで構成されている
【必須(MUST)】
以下のいずれか、または複数の実務経験(1年以上)もしくはそれに準ずる研究実績
・動画・画像認識(物体検出、行動認識、セグメンテーション等)
・VLM / マルチモーダルモデル(Vision-Language系モデルの学習・活用)
・LLM(ファインチューニング、RAG、プロンプトエンジニアリング等)
・Python を用いたソフトウェア開発経験(1年以上)
・Deep Learningフレームワーク(PyTorch 等)の実践的な利用経験
【歓迎(WANT)】
・Video Understanding / Action Recognition 分野の研究・開発経験
・Vision-Language Modelの学習・活用経験
・LLM / VLM の post-training 経験(SFT、instruction tuning、RLHF・DPO 等の強化学習ベースのアライメント)
・動画や画像を対象としたRAGシステムの設計・構築経験
・エッジ推論の最適化(TensorRT、ONNX Runtime、量子化・蒸留等)の経験
・リアルタイム映像処理パイプラインの設計・実装経験
・製造業ドメインの知見
・論文の執筆・国際学会での発表実績
・英語でのコミュニケーション能力(グローバル展開に伴い活用機会あり)
【その他】
求める人物像
・最新のAI技術動向を積極的にキャッチアップし、プロダクトに応用できる方
・技術で社会に貢献したいという意欲のある方
・不確実性の高い環境でも自律的に仮説を立て、検証・改善を繰り返せる方
| 就業形態 | 正社員(無期) |
|---|---|
| 年収(フルタイム時) | 700万円 〜 1,000万円 |
| 勤務地 | 東京都文京区 本郷2丁目38番16号 いちご本郷三丁目ビル703 |
| 勤務時間(フルタイム時) | 10:00~18:00 |
| 休日・休暇 | ・完全週休2日制(土‧日) ・祝日 ・年末年始休暇 ・夏季休暇 ・GW⻑期休暇 |
| 待遇・福利厚生 | 【勤務条件・その他】 フレックスタイム制 標準労働時間:8時間‧休憩時間:60分 平均残業時間:平均30時間∕月 社会保険完備(健康保険‧厚生年金保険、雇用保険‧労災保険) 【待遇】 月給 583,000円 〜 833,000円 年収7,000,000円〜10,000,000円 ストックオプション制度あり 賞与1ヶ月分 業績に応じて変動 |
| 試用期間 | 試用期間3ヶ月、処遇変更なし |
事業開発コアメンバー|元キーエンスの営業部長直下|大手製造業向け最先端AIプロダクトの事業開発!
| 勤務地 | 東京都文京区 |
|---|---|
| 職種 | 営業・CS(法人向け) 商品企画・販促 事業開発・営業企画 |
【Webアプリ開発 シニアエンジニア】工場の組み立て作業の動画を解析するAIソフトウェア開発/大手製造業で全面導入実績あり/少数精鋭のチーム/裁量大
| 勤務地 | 東京都文京区 |
|---|---|
| 職種 | フロントエンドエンジニア サーバーサイドエンジニア |
人生をかける、
スタートアップに出会おう。成長性のあるスタートアップ・ベンチャーのみを掲載