Amazon Science Fellow, JCI Science and Data
Amazon
Tokyo, Japan
Description
日本の大学で機械学習や関連領域の研究に従事している学生の皆様に向けたフェローシッププログラムのご案内です。Amazon JapanのRetail Scienceチームでは、何百万人もの顧客にインパクトを与える価値あるテクノロジーに繋がるような、新しいプロトタイプやコンセプトを開発するプロジェクトに従事していただく学生を募集しています。プログラムは1ヶ月から3ヶ月の短期間のプロジェクトになります。
プロジェクトの対象となるテーマには、自然言語処理、表現学習、レコメンデーションシステム、因果推論といった領域が含まれますが、これらに限定されるわけではありません。プロジェクトは、チームのシニアサイエンティスト1名または複数名のガイダンスのもとで定義、遂行され、プロジェクト中は他のサイエンティストもメンターとしてフォローします。
学生の皆様が新しいモデルを考案したり、新しいテクノロジーを活用し実験する時間を最大化できるようにすることが目標です。そのため、プロジェクトではエンジニアリングやスケーリングよりも、プロトタイピングを行い具体的に概念実証を行うことに集中します。
また、Amazonでは論文出版も推奨しています。従事した研究開発活動の成果物として出版される論文には著者として参加することになります。
フェローシッププログラムは目黒の東京オフィスで、他のチームと一緒に行われます。Amazonは、プログラム期間中に必要なIT機器(ラップトップなど)、給与と通勤費を支給します。
Are you a current PhD student enrolled in a Japanese university researching Statistics, Machine Learning, Economics, or a related discipline? The Japan Retail Science team is looking for Fellows for short term (1-3 months) projects to develop new prototypes and concepts that can then be translated into meaningful technologies impacting millions of customers.
In this position, you will be assigned a project to carry out from areas including but not limited to natural language processing, representation learning, recommender systems, or causal inference. The project will be defined and carried out under the supervision of one or more of our senior scientists, and you will be assigned another scientist as a mentor to follow you during the project.
Our goal is to maximize the time you spend on inventing new models and experimenting with new techniques, so the work will concentrate on prototyping and creating a tangible proof of concept, rather than engineering and scaling. Amazon encourages publications, and you will be included as an author of any published manuscript.
The fellowship will be carried out from our Tokyo office in Meguro together with the rest of the team. Amazon will provide the necessary IT equipment (laptop, etc.) for the duration of the fellowship, a salary, and commuting expenses.
Key job responsibilities
このフェローシップは、次世代のAIデータエージェントを可能にするために、大規模なデータログから自動的にセマンティックレイヤーを構築することに関するものです。私たちは、ビジネスユーザーがクエリを実行するクラスターを維持しており、そのログに完全にアクセスできます。私たちは、これらのログをマイニングして自動的にセマンティックレイヤーを構築することを提案します。これは、テーブルに何が含まれているか、それらがどのように関連しているか、ビジネスがメトリクスをどのように定義しているかについての構造化された記述です。このレイヤーがなければ、AIエージェントは曖昧な列名、重複するテーブル定義、または異なるチームが異なる方法で計算するメトリクスを区別する方法がないため、正確なSQLを確実に書くことができません。このレイヤーを手動で構築することは高コストで不完全であり、すぐに陳腐化します。私たちのアプローチは手動のキュレーションを回避します。ユーザーが時間をかけて書いたすべての結合、集計、フィルターは、列が実際に何を意味するか、テーブルがどのように接続されるか、メトリクスがどのように計算されるかについての暗黙的な知識をエンコードしています。このクエリコーパスを解析し統計的に分析することで、曖昧性解消ルール、合意されたメトリクス定義、検証済みのテーブル関係を自動的に抽出できます。セマンティックレイヤーにより、データチームはデータのオンボーディングや各変数のルールと定義の指定に帯域幅の大部分を費やす必要がなくなり、エンドカスタマーが自律的にデータをクエリするまでの時間を短縮できます。
This fellowship is about automatically constructing a semantic layer from large data logs to enable the next generation of AI data agents. We maintain clusters on which our business users run their queries, and we have full access to its logs. We propose mining those logs to automatically construct a semantic layer: a structured description of what our tables contain, how they relate, and how the business defines its metrics. Without this layer, AI agents cannot reliably write correct SQL because they have no way to distinguish between ambiguous column names, overlapping table definitions, or metrics that different teams compute differently. Building this layer manually is expensive, incomplete, and goes stale immediately. Our approach avoids manual curation: every join, aggregation, and filter our users have written over time encodes implicit knowledge about what columns actually mean, how tables connect, and how metrics are calculated. By parsing and statistically analyzing this query corpus, we can automatically extract disambiguation rules, agreed-upon metric definitions, and validated table relationships. The semantic layer will enable data teams to avoid having to spend most of their bandwidth on onboarding data and specifying the rules and definition for each variable, shortening the time for our end customers to autonomously query data.
A day in the life
チームの多くのメンバーは、午前9時くらいから10時半くらいまでの間に仕事を始め、夕方6時から7時には仕事を終えています。出席が必要なミーティングに参加していれば、勤務時間は自由に決められます。
パートタイムを希望する場合、勤務時間数は採用担当者とともに決定します。フルタイムの場合、労働時間は通常の契約通り週40時間となります。
The majority of the team starts working between 9 and 10.30am until 18-19. You will have complete flexibility to determine your working hours as long as you are present for the meetings where your attendance is required.
Number of working hours will be agreed together with the hiring manager in case you want to pursue the Fellowship part-time. In case of full-time, working hours will be 40/week as per a standard contract.
About the team
私たちのチームは、日本および世界のすべてのAmazonのベンダー企業に提供されるソリューションを支える製品を発明し、開発しています。私たちは、プロダクトマネージャーやビジネス関係者と協力し、科学的なモデルを開発し、インパクトのあるアプリケーションに繋げることで、Amazonのベンダー企業がより速く成長し、顧客により良いサービスを提供できるようにします。
私たちは、科学者同士のコラボレーションが重要であり、孤立した状態で仕事をしても、幸せなチームにはならないと考えています。私たちは、科学者が専門性を高め、最先端の技術についていけるよう、社内の仕組みを通じて継続的に学ぶことに重きを置いています。私たちの目標は、世界中のAmazonのベンダーソリューションの主要なサイエンスチームとなることです。
Our team invents and develops products powering the solutions offered to all Amazon vendors, in Japan and worldwide.
We interact with Product Managers and Business stakeholders to develop rigorous science models that are linked to impactful applications helping Amazon vendors grow faster and better serving their customers.
We believe that collaboration between scientists is paramount, and working in isolation does not lead to a happy team. We place strong emphasis on continuous learning through internal mechanisms for our scientists to keep on growing their expertise and keep up with the state of the art. Our goal is to be primary science team for vendor solutions in Amazon, worldwide.