SESに関わるユニークな「人」を紹介するSES Plusな人。
第6回は、ブラジル出身、27歳で日本に帰国しデータサイエンティストとして活躍している山下 俊恵さん(やましたとしえ)さんにインタビューしました。
インタビュアーは、現役大学生であり、アイドルユニット「notall(ノタル)」のメンバー音井結衣(おといゆい)さんです。ブラジル、日本と2つの国で数学を学んだ山下さんは、生きたデータの魅力に取りつかれ、データサイエンティストの仕事を始めます。実際のデータサイエンティストの仕事とはどのようなものでしょうか?山下さんが語る、リアルなデータサイエンティストの世界をぜひご覧ください。
■プロフィール□
◇山下 俊恵さん◆
経歴:
Modis株式会社社員
入社:2019年4月
前社:機械学習のシステム開発。大学で確率統計や実験計画の非常勤講師。
研究員、大学や専門学校での非常勤講師、シンクタンク系企業で、データ分析、データマイニング、データサイエンス、AI機械学習や関連システム開発プロジェクトに参加。
専門はビッグデータ、大規模データ処理、分析、AI機械学習。
現在はデータサイエンティストとして官公庁にて副業中。
◇音井結衣さん
経歴:
アメリカ・ケンタッキー州出身
アイドルユニット「notall」のメンバー
ビデオゲーム「ロードモバイル」大型看板「ケンズカフェ東京」イメージガール
2020全日本ガールズダンスコンテスト2020特別賞
名前を、以下で表記します。
山:山下さん
音:音井さん
■AI機械学習やデータサイエンスの研修に従事□
音: 現在携わっている業務内容について教えてください。
山:現在、AI機械学習やデータサイエンスに関する研修の開発や実施をしています。
また関連する技術アドバイザーもしています。
音:技術アドバイザーもされているんですね。
■憧れのデータサイエンティストへ□
音:これまで様々なキャリアを積まれているかと思いますが、最初にエンジニアの仕事に興味をもったきっかけは何ですか?
山: 大学では数理科学において、統計学を専攻していました。また、インターンでデータ分析や統計システムの開発を経験しました。インターンをしていた企業では「資格を取得したい」という人達がいて、アドバイスもしました。そこで、エンジニアの方々に関わり、エンジニアに興味を持ったのが最初のきっかけです。
音: エンジニアの仕事を始めて体験された時と実際に仕事に就かれた後で、エンジニアのイメージは変わりましたか?
山: 昔は業務がシンプルだったのですが、今は技術がどんどん変わってきていて難しくなったと感じています。
■代々数学好きな一家に生まれデータの魅力に取りつかれる□
音: データサイエンティストの領域に興味を持ったきっかけは何ですか?
山: 私の家族は代々数学が好きで、教育関係やエンジニアの仕事をしていました。
また、私の父は統計学に携わっており、私に統計学をおすすめしてくれました。その際に、これからは情報の時代が来ることから統計学が重要であると考え、データサイエンスの道へ進みました。
音: 実際にデータサイエンティストをやっていて大変だと思う事や逆にやって良かったと思ったことはありますか?
山:そうですね。データサイエンティストをやっていて良かったことはあります。データサイエンティストをやっていて良かったことは、実務を経験できたことです。大学時代、先生にお願いしてパソコンを使わせてもらい生のデータ分析をしていました。その理由としては、本を読むだけではなく実践経験を積みたいと考えたためです。
そこでは、早い段階で生のデータを分析し、プログラミングやソフトウェアの操作にも慣れ、徐々に大型のコンピュータに触れるようになりました。
また、大学では様々な研究が行われており、多くの専門的なデータがありました。例えば、ブラジルには色々な種類のトウモロコシがありますが、種類・肥料・植え方で「どのようなトウモロコシができるのか」についての分析を先生たちの手伝いをしながら行っていました。
そこでは、グラフの作成や平均値を求める計算から始め、徐々にできることを増やしていきました。そういった経験の中でデータの面白さや難しさがわかるようになりました。
音: 今まで経験した中で一番興味を持ったデータは何ですか?
山:今まで経験した中で一番興味を持ったデータは品質管理のデータです。正常な状態が異常な状態になる時のデータの動きや、時間ごとに異なるデータの分析が面白いと感じました。
音:品質管理のデータ分析が一番面白いと感じたのですね。
■数学で語学の壁を乗り越える□
音: 海外の大学と日本の大学で感じた違いは何ですか?
山: 大枠で見ると実はそれほど違いがありませんでした。数学や統計の授業内容、試験の実施方法や研究室の雰囲気などが日本と似ていて、共通点が多かった印象です。私がブラジルにいた時は、現地の言葉であるポルトガル語が話せませんでした。
しかし、ポルトガル語がわからなくても数学の授業だけは理解できました。そのため数学をたくさん勉強しました。このように数学は他の分野より国内外関係なく通じると感じました。
日本では大学院から入りましたが、先生が結構米国での滞在期間が長い方で、資料はほとんど英語でした。大学時代、日本語はほとんど使っていなかったので、仕事を始めてから日本語を身に付けました。
また、先生が海外から色々な方を招待していたので、大学の環境は本当に国際的でした。習った先生には感謝しています。そこでは、技術的な話は全部通じたのですが、それ以外はわからなかったです。
音:数学は国内外関係なく通じるのですね。
■ビックデータの登場によりデータサイエンスの難しさを知る□
音: これまでのエンジニアとしてのご経験の中で、特に大変だったエピソードがあれば教えてください。
山: 2014年からデータサイエンスに関わってきましたが、その時ビックデータという概念が登場しました。ビッグデータは細かい時間ごとにどんどんデータが発生します。数日、数週間、数ヵ月、数年間の蓄積があるのですが、データが本当に膨大でした。「データをどう使えばいいか」や「どう分析すべきか」を考え、理解するのに非常に苦戦しました。他の人がどのように分析しているのかを調査し、繰り返し取り組むことで、ようやく理解できるようになりました。
音:ビッグデータの分析に苦戦したのですね。
■官公庁で副業に就く□
音: 官公庁で副業をされていると伺いましたが、その経緯について教えてください。
山: データサイエンスのコンペに登録しており、その運営会社経由で官公庁の方から私宛にメールが来ました。メールは「働いてみないか」という内容で、短い期間でしたがオファーを受けることにしました。
音:差支えない範囲で大丈夫なのですが、業務内容はどういったものですか?
山:多くは言えないのですが、データサイエンスの様々な質問に対して調査して回答したり、研修をしたりしていました。
音: 副業が辛いと思うことはありましたか?
山:データがない状態で様々な分析をしなければいけないことが大変でした。
例えると、新しいビジネスを作るにはどうしたら良いかや、自分で情報を探して新しいビジネスを作るような感じでした。
それは、学習アルゴリズムの一つで「モデルフリー」と言われていますが、頭を悩ませました。世の中は明日何が起きるかわかりません。そのため「そんな分析をどうやってやるの?」と悩みました。
そこでの私の仕事は、自分でデータを探してルールを作ることでした。AIはデータを探すだけでは成り立ちません。データを探すだけではなく、データをどう学習させるかといったAIの仕組みづくりが必要でした。
音:データがない状態からの分析は大変ですね。
■データサイエンティストの魅力は年齢問わずできること□
音: データサイエンティストという仕事の魅力について、教えてください。
山: データサイエンティストは年齢に関わらず、長く働けることが魅力です。
IT業界は変化が激しく分野によって開発の仕方が大きく変わるため、若手が求められています。特に開発などは30代定年説と昔から言われていますが、古い考えの人達はどんどん捨てられていきます。
昔、私が少しSEをやっていた時には、40代のSEの方は「おじいさん」と言われていました。一方で、データサイエンティストはそういったこともなく、若手から年配の方まで安心して長く働けると感じています。例えば、私の恩師は82歳ですが現役で働いています。
このようにIT業界は変化が激しく、SEの場合は経験が役に立たないことがありますが、データサイエンティストは経験がものを言います。
経験を積み重ねて仕事ができるようになったことは嬉しいですね。私の場合も若い時は残業してもわからないことが多かったのですが、今は経験があるため違います。
音: データサイエンティストは何歳から始めた方が良いのでしょうか?
山: データサイエンスの仕事は何歳からでも始めることができます。
データサイエンスには、ビジネス・エンジニアリング・分析の3つの側面があります。
例えば、医療分野で長年働いていた方というのは、医療分野において既にデータに触れています。そのため現場のビジネスを理解しており、それをどう自動化すればよい方向に進むのかが理解できます。
もちろん自動化などエンジニアリングに関する知識を学ぶことは必要ですが、
ビジネス面での経験を生かすことで成果を出すことができます。
また、ビジネスの経験がない若い方の場合は、モディスの見習いの研修を3ヵ月受けることでプログラミング・データ処理・分析ができるようになります。
現場での知識がなくても、プログラミング・グラフ作成・平均値の計算などの仕事から始め、徐々に現場の経験を積んでいきます。
こういったようにデータサイエンティストは年齢に関係なく何歳でも始めることができます。
例え一緒に働くメンバーの年齢が異なる場合でも、年配の方は若い方に現場の知識を教え、年配の方は若い方から統計を学び、お互いに補い合うことができます。
音:一緒に働く年齢が違ってもお互いに助け合うのは素敵ですね。
■データサイエンティストとして必要なこと□
音: データサイエンティストをこれから目指したい方と、データサイエンティストとしてよりスキルアップしていきたいという方へ向けて、勉強すべきことや経験すべきことについて何かアドバイスがあれば教えてください。
山: 自分が持っている知識を活用することが大切です。何か得意なことがある方は、自身の経験とデータサイエンスをうまく結びつけることで、データサイエンスを道具として扱うことができます。
例えば、プログラミングが得意な方は開発から始め、自分が足りない部分を勉強すると必ずデータを活用できるようになります。全くプログラミングの経験がない方は、まずはプログラミング・数学・分析を勉強していけば良いと思います。
数学が苦手だと少し時間はかかりますが、得意であれば3ヵ月ぐらい研修を受けるとデータサイエンティストとしてのキャリアをスタートすることができます。
あとは、データサイエンティストには辞めない努力が必要です。最初の1年目はきついと感じることも多いですが、2年目は楽になり徐々にできることが増えていきます。
音:今まで経験した知識を活かすことも重要なのですね。
■データサイエンティストとしてSESで働く魅力□
音: エンジニアが転職する上で、キャリアアップ、給与アップ、ワークライフバランスなど様々な軸があるかと思いますが、その上でSESで働くことの魅力は何だと思われますか?
山: SESはどのお客様のところに配属されても経験が積めることが魅力です。データサイエンティストは経験を積むと別の配属先でもそこで得た経験を活かせます。特に若い頃は仕事が最初わからなくても、データサイエンスの仕事をやっていくうちにどんどんわかるようになっていきます。
現在では「データサイエンティストは給料が良くて、お金持ちになれる」と言われているようですが、私が始めた時はそうではなく今急激に給与が上がっています。なぜなら、データサイエンティストは給料が良い分、難しい仕事だからです。そのため、最初から給料が高くて難しい仕事ではなく、給料が安くてもとりあえずやってみて、徐々に価格アップするのが重要です。
社員だとデータサイエンス以外の業務もする必要が出てきます。そのため、データサイエンティストは、ワークライフバランスがないといわれるほど最初は残業が多いです。仮に会社で残業がなくても、勉強をしないとデータサイエンティストとして働くことは本当に難しいです。
現場もデータサイエンスがわからない状態ですし、お客様にも聞かれることが多いので勉強が好きな方に向いています。また、失敗を恐れず調べていくうちに、日に日にデータサイエンティストとして成長していることがわかってきます。続けると必ずわかる時がきます。
音:最初はわからないことが多くても諦めずに継続することが大切ですね。
■山下さんにとっての【SESとは】
音:最後に……。
山下さんにとってのSESとはなんですか?
山:私にとってSESとは、他の仕事をやらずにデータサイエンスだけに専念してスキルアップできる場所です。データサイエンスは業務に特化した内容だけをした方が効率的にスキルアップすることができます。
■まとめ□
本記事でご紹介した山下さんは、大学で統計学を座学として学ぶだけでなく、生のデータを分析するという経験をし、データサイエンスの楽しさに気づきました。
データサイエンティストは年齢問わず目指せます。未経験の若い方であれば研修で知識を習得し、少しずつ実務をこなすことでデータサイエンティストとして活躍できます。
一方で、年配の方は、今までのビジネスでの経験をデータサイエンスに活かすことで成果につなげることができます。このように様々な年齢のデータサイエンティストがお互いを補うことでプロジェクトを成功へと導くことができるのです。
この記事でデータサイエンスに少しでも興味を持った方は、この機会にぜひデータサイエンスを学んでみませんか。