野村総合研究所データサイエンティストによる
情報発信サイト

Nishika 睡眠コンペ 1位 解法の紹介

こんにちは。NRIデジタル データサイエンスの柴です。2022年11月~2023年1月の期間でNishikaで開催されていた「睡眠段階の判定 〜”睡眠の深さを判別しよう”〜」コンペ(以下、睡眠コンペ)に、同じくNRIデジタル データサイエンスの滝口さんと松崎さんと柴の…

NRI's Data Scientists Attempt to Predict NFT Prices (Part 1)

NFT Price Prediction Challenge(road to "Appraiser" of digital art) Hello everyone, we are Naohiro Manabe, Ryuichi Kikkawa, Kazuteru Hirahara, and Ryo Nakai, data scientists of the NFT analysis team from Nomura Research Institute, Japan. "…

お金持ちには価値観の異なる3タイプが存在する?~NRI生活者1万人アンケートを活用した価値観クラスタリング~

こんにちは。NRI CXコンサルティング部の平原一輝/松井拓郎です。 本記事ではNRI独自の調査アンケートである「生活者1万人アンケート」を活用した価値観クラスタリングの事例についてご紹介します。特にお金持ちの価値観の違いに基づいて、どのような行動特…

時系列予測モデルの実践論5

時系列のクラスタリングとアンサンブル 鈴木雄大, 池野心平, サトヤキ・ロイ こんにちは、NRIの時系列予測チームの鈴木です。 第4弾までの記事で、iterativeモデルとglobalモデルを導入し、それぞれ優れた点があることを紹介しました。 今回は第5弾として…

Practical Theory for Time Series Forecasting Models 4 -A Case of the Past Kaggle Competition-

Satyaki Roy, Shimpei Ikeno, and Yuta Suzuki Global ML-powered methods such as Gradient Boosted Trees for time series Why do we need global models? In the last blog post, we saw how to train and forecast individual time series data and aggr…

時系列予測モデルの実践論4 -昔のKaggleを事例に-

サトヤキ・ロイ 池野心平 鈴木雄太 GBTなどの機械学習を用いたグローバルモデルでの時系列予測 なぜグローバルモデルが必要なのか 皆さんこんにちは。NRIの時系列予測チームのデータサイエンティスト、Satyakiです。今回も時系列モデルについて、機械学習(ML…

Kaggle RSNA 2022 10位 解法の紹介 ~頸椎のCT画像から骨折の有無を予測する~

こんにちは。NRIデジタルの奥山です。 2022年10月までKaggleで開催されていた「RSNA 2022 Cervical Spine Fracture Detection」コンペ(以下、RSNA2022)に、NRIデジタルの大崎さんと奥山、そして社外の方1名を加えた計3名のチームで参加し、883チーム中10位…

Kaggle Community Competition機能を使ったコンペ開催までの工夫と留意点

はじめに この記事はKaggle Advent Calender 2022の17日目の記事です。 今回初めてKaggle Advent Calendarを書かせていただきます。最近、Kagggle Community Competition機能を使った内輪コンペを開催する機会があり、その際に工夫した点や、今後の開催時に…

「個人情報」に該当する情報の考え方

分析データが個人情報にあたる? こんにちは。NRIでデータガバナンスを専門に活動しています南島と申します。 皆さんが普段分析対象としているデータに関して、これって個人情報にあたるのかな?と疑問に思われたことはありませんか。もし個人情報に該当する…

時系列予測モデルの実践論3 -昔のKaggleを事例に-

前回の振り返り パート2では多系列・時系列予測モデルを行うための、特徴量エンジニアリングを行いました。 生成された特徴量は、外生的なものだけでなく、時系列特有の要素を表現していることが重要でした。 Iterativeモデルによる多系列・時系列予測 みな…

NRIのデータサイエンティストがNFT価格推定に挑戦(第1回)

NFT価格推定への挑戦(デジタルアートの"鑑定士"を目指して) みなさんはじめまして、NRIのデータサイエンティストからなるNFT分析チーム(眞鍋尚大、吉川龍一、平原一輝、中井亮)です。 最近、「NFT」というキーワードが話題を集めており、気になっている…

ProbSpace 日本画の登場人物分類 1st Solution

はじめに こんにちは。NRI 向後と申します。 先日、データ分析コンペサイトProbSpaceで開催された「日本画の登場人物分類」コンペティションに参加させていただき、 参加ユーザ数165名のうち1位を獲得することができました。 こちらの記事に私が取り組んだコ…

Practical Theory for Time Series Forecasting Models 2 -A Case of the Past Kaggle Competition-

Part2 EDA and Base Model Shimpei Ikeno, Satyaki Roy, Yuta Suzuki, and Takeru Sone2022-07-12 In Part I… We introduced our approach to building a practical multivariate time series forecasting model. We introduced the data set from a past Ka…

Practical Theory for Time Series Forecasting Models -A Case of the Past Kaggle Competition-

Part1 EDA and Base Model Shimpei Ikeno, Satyaki Roy, Yuta Suzuki, and Takeru Sone2022-07-12 Purpose of This Blog Series: Introduce How to Use a Practical Multivariate Time Series Forecasting Model Welcome to our Data Science Blog! I am Shi…

なぜF1スコアでは「調和平均」が使われるのか。調和平均の意味を考える。

NRIのデータサイエンティスト、田村です。本記事では、よく使われる相加平均と異なり、普段あまり馴染みのない「調和平均」の意味について考えてみたいと思います。 さまざまな代表値と、さまざまな平均値 世の中には様々なデータがありますが、複数のデータ…

時系列予測モデルの実践論2 -昔のKaggleを事例に-

Part2 特徴量エンジニアリング 前回の振り返り... パート1では、実践的な多変量時系列予測モデルを構築するためのアプローチを紹介し、過去のKaggleコンペティション のデータセットを用いて、ベースラインとなるSeasonal Naiveモデルを作成しました。 今回…

航空経路(ウェイポイント)の推定 ~SIGNATEコンペ~

はじめに ~分析の組み立てメインです~ みなさま初めまして。NRIの小川と申します。 先日、データ分析コンペサイトSIGNATEにて開催された「テクノプロ・デザイン社 飛行機の航空経路の推定チャレンジ」(https://signate.jp/competitions/721)に参加し、一般…

時系列予測モデルの実践論 -昔のKaggleを事例に-

Part1 なにはなくともEDA&ベースモデルつくりから! Shimpei Ikeno2022-07-12 本連載の目的:実践的な”多系列”時系列予測モデルの解き方を紹介 みなさんはじめまして。NRIのデータサイエンティスト、時系列予測プラクティスチームの池野です。Wikipediaによ…

新型コロナウイルスで消費行動はどう変わったか~酒の消費額の変化を因果推論で検証してみた~

こんにちは、NRIデータサイエンス 因果推論チーム(阿部泰己、井形健太郎、大島拓人、曽根建、松井拓郎、鈴木雄大)です。因果推論のビジネス上での活用方法を簡単な事例を用いてご紹介します。テーマは新型コロナウイルスによる酒の消費額の変化です。 1章 …