製造業・メーカー・ITのエンジニア転職ならMEITEC NEXT

株式会社ミスミ

【東京】SRE(リーダー候補~メンバー)/ AI検索プラットフォームの信頼性向上

この求人への応募・問い合わせ

求人情報

職種
ネットワーク/データベース/サーバー
勤務地
東京都千代田区九段南1丁目6番5号 九段会館テラス
年収
700万~1,000万円
仕事内容
AI検索機能(キーワード検索、ベクトル検索、AIレコメンド等)を提供するプラットフォームの信頼性向上、パフォーマンス改善、開発効率化をリードしていただきます。

1.信頼性向上・スケーラビリティ確保(Reliability & Infrastructure):40%
グローバル展開(10→100のスケール)に耐えうるインフラ基盤の設計・構築・運用をリードします。
コンテナ基盤の高度化: GKE (Kubernetes) / Cloud Run を活用した、高負荷に耐えうるオートスケーリング基盤の構築と運用。
SLI/SLOの導入・運用: サービスの信頼性を定義し、エラーバジェットに基づいた運用ルールの策定と、開発チームへの信頼性文化(Reliability Culture)の浸透。
グローバルインフラ設計: 各国のレイテンシ要件を満たすマルチリージョン構成やCDN戦略、ネットワーク設計の最適化。

2.パフォーマンス・エンジニアリング・可観測性(Performance & Observability):40%
「AIの賢さ」と「検索エンジンの速さ」を両立させるためのチューニングと監視環境を整備します。
検索基盤の高速化: Elasticsearchやベクトル検索エンジンのインデックス設計、クエリパフォーマンスのボトルネック特定と解消。
分散トレーシングの確立: マイクロサービスとAIモデルを横断するリクエストフローを可視化し、障害発生時の原因特定時間を短縮する。
コスト最適化 (FinOps): クラウドコストやAIリソース(GPU等)の使用状況を監視し、性能を維持しつつのコスト削減を提案・実行する。

3.DevEx向上・チームマネジメント(Developer Experience & Management):20%
開発チーム全体の生産性を最大化するための環境整備と、技術的なリードを行います
Toil(労苦)の削減: 手作業によるオペレーションを自動化し、エンジニアが創造的な作業に集中できる時間を創出する。
CI/CDパイプラインの進化: テスト自動化、カナリアリリース等のデプロイ戦略を実装し、安全かつ高速なリリースサイクルを実現する。
技術共有・育成: SREプラクティスの勉強会実施やコードレビューを通じ、開発メンバーのインフラ・運用スキルの底上げを図る。

■仕事のやりがい(面白さ)
「AI×検索」という高難易度領域への挑戦:
単なるWebアプリとは異なり、重いAI処理とミリ秒単位のレスポンスが求められる検索エンジンが混在する環境です。この「精度 vs 速度」のトレードオフに対し、インフラやミドルウェアのチューニングで解決策を提示するエンジニアリングの醍醐味があります。
大規模グローバルサービスへの成長フェーズ:
月間数千万PV規模かつグローバル展開という、トラフィックが急増するフェーズに立ち会えます。スケーラビリティの課題が顕在化する前に手を打ち、システムが安定して成長していく様を支える達成感は格別です。
SRE文化の立ち上げ:
専任のSREとしては初期メンバーに近い立ち位置となるため、監視体制の構築や障害対応フローの整備など、自らの手で「組織のSRE文化」をゼロから作り上げる経験が積めます。

■3~5年後の想定されるキャリアパス
全社のインフラ戦略やクラウドアーキテクチャを統括する「プラットフォームエンジニアリングリード / CCoeリード」
AI/MLシステムの運用・パイプライン構築に特化した「MLOpsエンジニア / AIアーキテクト」
特定技術(検索エンジン、K8s、DB等)を極め、技術的な最終意思決定を行う「スペシャリスト / プリンシパルエンジニア」
エンジニアリング組織の生産性やピープルマネジメントを担う「VPoE / エンジニアリングマネージャー」

■業務上の課題
基盤のマイクロサービス化やAI機能の融合は完了していますが、SRE視点では以下の課題が待ち受けています。これを共に解決してくれる方を求めています。

「10→100」のスケールに耐えうるアーキテクチャへの刷新
現在の基盤は稼働していますが、今後予想されるグローバル規模の急激なトラフィック増大に対し、現行の構成では運用負荷やコストが指数関数的に増えるリスクがあります。先回りしてボトルネックを予測し、オートスケーリングの最適化やDBのシャーディング、キャッシュ戦略の再設計など、抜本的なスケーラビリティ対策が必要です。
複雑化するシステムの「可観測性」の確立
AIモデル、検索エンジン、APIが複雑に連携しているため、障害発生時に「どこで遅延しているか」「なぜ検索結果が出ないか」の特定に時間がかかるケースがあります。単なる死活監視を超え、分散トレーシングやログ分析を高度化し、異常を予兆段階で検知できるレベルまでオブザーバビリティを高めることが急務です。
開発スピードと安定性のバランス(Error Budgetの運用)
機能開発チームは「アジャイルな改善」を求めていますが、変更頻度の増加は障害リスクを高めます。「変更を止める」のではなく、「安全に失敗し、即座に復旧できる」ガードレールをシステム的に構築し、開発速度を落とさずに信頼性を担保する仕組み作りが必要です。

使用ツール
クラウド・インフラ: GCP (Cloud Run GKE Vertex AI) AWS
検索エンジン: Elasticsearch Vertex AI Search
IaC・CI/CD: Terraform GitHub Actions
モニタリング: Datadog Cloud Operations (旧Stackdriver) 等
言語: Python Go (ツール作成やスクリプト等で使用)
DB/Cache: Redis Firestore Cloud SQL BigQuery
コミュニケーション: MS Teams GitHub Projects

その他
リモートワークと出社のハイブリッド勤務、フリーアドレス制など、柔軟で働きやすい環境です。
応募条件
【必須】
パブリッククラウド(GCPまたはAWS)におけるインフラ設計・構築・運用経験(目安:3年以上)
コンテナ技術(Docker Kubernetes)を用いた本番環境の運用経験
Terraform 等のIaCツールを用いたインフラ構成管理の経験
Webアプリケーションの開発・運用プロセス(CI/CD、バージョン管理)への深い理解
スクリプト言語(Python Go Bash等)を用いた運用自動化の経験

【歓迎】
Elasticsearch / Solr 等の検索エンジンの運用・チューニング経験(特に歓迎)
SLI/SLOの策定・運用や、トイル削減などのSREプラクティスの実践経験
大規模トラフィック(高負荷)環境下でのパフォーマンスチューニング経験
マイクロサービスアーキテクチャにおける可観測性(Distributed Tracing等)の設計・導入経験
機械学習パイプライン(MLOps)に関連するインフラ構築経験
休日休暇
完全週休2日制(土日)/祝日/年末年始(12/29~1/4)※ただし、業務の都合で休日を他の日に振替えることがある 有給(初年度:即日付与。日数は入社日によって変動。次年度以降:4月に付与) 慶弔休暇 特別休暇
年間休日数
124日
就業時間
09:00~17:30

この求人への応募・問い合わせ

企業情報

企業概要
※売上高、従業員数はグループ連結数字です。持株会社のミスミグループ本社は東証プライム上場企業です。<グローバル26万社の製造業を、800垓(1兆の800億倍)通りの商品で支え、プライム上場企業の中でも有数の高成長・高収益を実現し続けるグローバル企業>
◆メーカー事業:FA(ファクトリー・オートメーション)装置用部品、金型部品等の企画・開発・製造・販売
 ※世界のあらゆる製造業(BtoB)に「商品標準化」によるカタログ販売と、商品を1個からでも2日で出荷する「確実短納期一個流し」によって高品質(Quality)、低コスト(Cost)、確実短納期(Time)の「QCTモデル」を実現
◆流通事業(VONA):製造現場で使用する部品・道具等をミスミブランド以外の他社製品も含めたワンストップ提供サービス
 ※取り扱い点数は2070万点、取扱メーカー数は3300社以上
従業員数
11,682人

この求人について詳しく知るには?

上記の情報は、求人情報の一部のみです。
転職支援サービスにご登録いただくと、業界・技術に精通した専門のコンサルタントから、
より具体的な求める人物像や、選考通過のポイントなどをご案内します。

陣内健志
(担当コンサルタント: 陣内健志)

この求人への応募・問い合わせ

お電話でのお問い合わせ
フリーダイヤル0120-964-228受付時間 月~金 10:00~18:00

求人ID No.0265071 ※応募・お問い合わせの際はこの番号をお伝えください