レトリバのインターンに参加しました

シェアする

  • このエントリーをはてなブックマークに追加

お久しぶりです。ふるやんです。

インターン中に何回かブログを更新しようと思っていたのですが、Wi-Fi環境がモバイルルータのみで提供されていたため、更新しませんでした(訳:面倒だった)。

インターン参加記を書くとレトリバのTwitterアカウントに宣伝されるらしいので、真面目に書いてみます。

TL;DR

音声認識を触れて楽しかったし勉強になった。

アナログゲームが楽しかった。

あなたは誰?

私は大阪大学大学院(基礎工学研究科)で音声信号処理の研究をしている修士一年生です。

音声認識はJuliusを使ったことがあるのと、去年の後期に研究室でIT textの『音声認識システム』という書籍を用いた勉強会を行っただけで、実際に開発したことはありませんでした。

ちなみにこの書籍は、改訂前だったのか分かりませんが、誤植だらけで、数式の間違いの確認が勉強会の大半のタスクになっていました。おかげで数式をちゃんと理解できた。

レトリバのインターンに参加しました

「株式会社レトリバ(Retrieva, Inc.)」って皆さんご存じでしょうか。

私はICPCの協賛企業だということで名前は知っていました。

「夏のITエンジニアインターンの情報が集まる魔法のスプレッドシート」というGoogleスプレッドシートのドキュメントが出回っており、そこでレトリバの名前を見つけ「ICPC協賛企業だ。確か音声認識やってたよな」と思い、エントリー。

ICPC協賛企業としてしか知らなかったので、「大して有名じゃない会社だし、そんなに志望者多くないだろう」みたいなことを思っていましたが(失礼の極み)、インターン仲間の参加記には

自然言語処理を前面に推しているレトリバインターンはトップクラスで行きたいものでした.人気が予想され,また枠も少ないので落ちる覚悟でした.

と書かれており、本日改めて私の失礼が発覚したのでした。(本当にごめんなさい)

どうやら、NLP(自然言語処理)の界隈では有名な会社らしいです。

社員さんに「うちは音声認識をあまり押しだしていないけど、なぜ音声認識をしたくてうちを受けたの?」というようなことを聞かれたことがありますが、僕もよく分かりません。そのときに「あれ? 押しだしてないの?」と思いました。

「音声認識 深層学習」とかでググるとメンターさんのSlideShareのやつが出てくるので、それでかもしれません。でもそのスライドってPFI時代のものなんですよね。なぜ僕はレトリバを音声認識の会社だと思ったのでしょう。本当に記憶がないのです。逆に考えると、運命ってやつですかね(適当)

音声認識をやっているという以外に、「期間が長い」「ちゃんとお給料が出る」という点が魅力的でした。

私は開発経験が浅く、Linuxをまともに扱ったこともありません(『シス管系女子』は読みました)し、リモートサーバへSSH接続してターミナル上で開発、みたいなこともほとんどしたことがありませんでした。また、ニューラルネットワークを動かしたこともほとんどありませんでした。GitHubのプルリクも未経験でした。

そんな状態で、5日間程度の短期インターンに行っても、基本的なスキルを身に着けることに多くの時間を使ってしまい、本質的なことがあまりできないのではないかという気持ちがありました。

また、学部3年生のときに3日程度のインターンのようなものに参加したことがあり、あまり参加する意味がないと感じていました。

そのため、1ヶ月以上のインターンでしっかり貢献したいなと思っていました。

あと、お給料はだいじ。メーカー系のインターンは軒並みお給料を出さないのですが、イミワカンナイ。交通費・宿泊費と昼食補助1000円のみ、みたいな。

お給料ゼロで参加するインターンって、会社に貢献できなさそうじゃないですか。「会社に貢献してほしい」という気持ちで募集するならお給料は出すでしょうから、「学生に勉強させてあげる」みたいな気持ちなのかな、と思ってしまいます。本番システムや製品に影響する部分を触らせてもらえなさそうなイメージ(あくまでイメージです)。

そんなこんなでレトリバインターンにエントリーし、PR文書か何かを書いて送ったら、課題が届きました。

課題内容は公開されていないっぽいので内容は伏せますが、競プロの部分点のように複数の段階が用意されており、「忙しいから途中まででいいかー」と思っていました。でも、1日暇ができたので結局全部やりました。

そしたら、オンライン面接の話が来ました。面接は楽しかったです。

そしてなんやかんやあって採用通知が来ました。PFNの結果待ちではありましたが、PFN受かってもレトリバに行くだろうなーと思っていました。

採用されたのは、研究班2名、開発班2名でした。私は研究班でした。開発班は元々1名の予定だったそうですが、社員さんがこの2名が欲しいと社長に主張し、2名になったみたいな話らしいです。自由。

活動内容

YouTubeで最終報告を見て。 https://www.youtube.com/watch?v=eYcJPtByhx4

ざっくり言うと、VADと音声認識の研究開発を行いました。

VADというのは、Voice Activity Detectionの略で、音声区間検出とも呼ばれる技術です。音声から、人が話している区間と雑音のみの区間を判別する技術のことを言います。

電話などでは、非発話区間は音を消した方が通信料が少なくなる、みたいな理由で利用されます。

音声認識においては、発話の区切れ目で音声を切って、ひとまとまりの音声を認識器に入力する目的で使用されます。

arXivなどを見ても、VADは割と盛んに研究されているテーマだと分かるかと思います。

音声認識は言わずと知れたアレです。「音声→発音」「発音→文章」という2段階があるのですが、私は前半(いわゆる音響モデル)を担当しました。ニューラルネットを使うのが当たり前の世界ですね。

最終報告で言った以上に書くことは無いので、この辺にしておきます。

業務以外のあれこれ

歓迎会で人々がアナログゲームをやっていました。私は社員さんとインターン仲間とお話をしていました。楽しかったです。

社外の人も招くピザパーティという謎の行事もありました。そこで私もアナログゲームをしました。トランプとか将棋とか以外のアナログゲームは見たことがあるだけであまりやったことは無かったですが、楽しかったです。

そしたら、アナログゲームをやるために休日に会社に集まるイベントが発生しました。もちろん強制参加ではありませんが、私は喜んで参加しました。いくつか買って研究室に置きたいなと思いました。

他にも、社員さんが超美味しい焼肉を奢ってくれたり、オシャレなバーベキューを企画してくれたりしました。幸せでした。

感想

環境がめちゃくちゃ良かった。社員さんも理由を明かさず有給休暇を取れているようですし、リモートワークもできました。

リフレッシュスペースがあるのも良いし、社員さんがよくリフレッシュスペースで休憩していたので、僕も気兼ねなく休憩できました。オフィスグリコがあるのも良い。カンパ制のお菓子が食べ放題なのも良い。ウォーターサーバーの水が飲み放題なのも、ペットボトルのお茶などが1日2本まで無料でもらえるのも最高。

待遇面(社員さんのお給料)については知りませんが、それ以外の面では、最高に近い環境だったんじゃないかと思います。いくつか気になるところがありましたが、それは改善されることがたぶん確定しています。

活動内容についても、今までやったことのない経験をたくさんさせてもらえました。非常に多くのことを学べたと思います。何より、音声認識器を触れたのが嬉しかったです。今までの人生の中で一番有意義な連続2ヶ月間だったんじゃないかな。

今後もレトリバでアルバイトをする話をいただいているので(大阪なのにありがたい)、研究とともに頑張ります。

もっと真面目な参加記が見たい

インターン仲間の参加記を見て

スポンサーリンク
レクタングル(大)
レクタングル(大)

シェアする

  • このエントリーをはてなブックマークに追加

フォローする