Opendata チームのご紹介
世界中のビジネスデータを再構成しユーザーにインサイトを届ける
StockmarkのOpendata Unitについてご紹介します
🆕News
ハルシネーションを大幅抑止し専門的な質問にも正確な回答が可能な生成AI ストックマーク 1,000億パラメータ規模の独自LLMを公開
💁プロダクト
サービス紹介
ストックマークのサービスは、日英中の3.5万サイトもの膨大な情報網から、自然言語処理を活用して、ニュース/ IR / 特許 / 論文 / 社内資料を解析し、最適な形で情報をお届けし、次世代のイノベーション創出&アイデア創出の仕組みを提供し、新しくビジネスチャンスを発掘する支援を行っております。
Anews
ナレッジマネジメントSaaS
日々生まれる膨大な情報やニュースから、あなたの知るべきことを届け、組織の壁を越えて共有を可能に。事業を創るアイディアの種を見つけることができる、ナレッジシェア推進サービスです。
Astrategy
市場分析SaaS
国内外約3万5千サイトの膨大な情報から、AIが組織や業務に合わせて必要な情報を構造化し、新規事業開発や製品開発に必要な示唆を得られる市場調査サービスです。
導入実績
🎥Anewsのデモ動画(1分49秒)
Anewsのプロダクトデモ動画がありますので、こちらからご覧ください!
👨👨👧👦 組織
Opendataチームのご紹介
私たちストックマーク及びOpendata Unitが目指すのは、Web上のあらゆるビジネス情報を再整理し、ビジネスシーンでのデータ活用業務を自然言語処理AIで総置換することです。そのために、世界中のニュース、企業情報、論文、特許などをWebから収集、抽出、加工して顧客に提供し、企業の製品化・事業化を加速させられるような「オープンデータリサーチサービス」を開発しています。
Opendataチームの取り組み
- 数万オーダーのWebサイトから汎用的に新着情報を収集、抽出するWebクローラー全般の開発と運用
- HTMLやPDFからコンテンツを抽出するMLアプリケーションのプロトタイプ開発
- FaaS/CaaSによる分散処理のパフォーマンスチューニングと監視設計
- MLワークフローとデータプラットフォームの設計/運用
クローリングの仕組み
Stockmarkのプロダクトは、日々発生する膨大なビジネス記事(10万件以上)を常にクローリングし続けています。クローリング対象のURL群を起点として、短期間でURL群を巡回して記事を収集します。収集した記事は、必要なデータのみを取得するため、構造を解析し・余分な情報を削除します。大量の記事に対して、これらの処理を、短期間・低コストで実現するためにAWS Lambdaを利用したスケーラブルなアーキテクチャで実装しています。
ストックマークのアーキテクチャを動画にしました!
技術情報の拡充
ニュース/論文/特許情報などを抽出、配信するためのデータパイプラインを構築
今後のデータ拡充戦略
課題
①Webクローラーの劣化
②コンテンツ抽出のノイズが多い
③Web以外のデータソース拡充
💻技術スタック
開発環境
[開発言語]
Python
[コンテナ]
Docker
[IaC]
Terraform
[クラウド]
AWS, GCP
💼ストックマークの働き方
ビジョンである顧客価値経営(カスタマーセントリック)を体現するために、個人の最大の権限を移譲し、自律分散型、そしてアジリティの高い組織へと進化しています。
🌈 働き方概要
制度名 | 概要 |
---|---|
【働き方】フレックスタイム制 | フレックスタイム制(コアタイム10:00-14:00)で自由に働くことができます。 |
【働き方】フルリモート | フルリモート可能。関東圏外にお住まいの方も大歓迎です。 |
【働き方】副業OK | 副業として他社のプロジェクトに参画することができます。 |
【手当】リモートワーク準備一時金 | 入社時にリモートワークを行うため必要な機材・備品の購入に充てて頂く手当です(入社時:50,000円) |
【手当】顧客と向き合う手当 | 顧客と向き合うために必要な書籍・備品・PC周辺機器購入のほか、セミナー受講費、コワーキングスペース利用費、有料記事購読費用、自己研鑽のための会食費用などに充てて頂くことを目的とした定額手当です。(年間240,000円) |
リファラル採用インセンティブ | 社員紹介経由での採用決定で紹介者にインセンティブが発生します |
募集要項
現在募集している職種は以下のとおりです。
【Dev】データプラットフォームエンジニア
🧑🤝🧑参考記事
Opendata TeamのインタビューやTech Blogをご紹介します!
[NEW]価値検証を高速化するために開発チームで意識していること(2023 / 7 / 3)
AIで高速なキュレーションを実現するストックマークのアーキテクチャ
個別最適でプロダクトを作り続けたスタートアップがデータ専任部隊を作ることにした話
【記事まとめ】ストックマークでエンジニアとして働く魅力10選!
ビジネスに必要な情報を世界中から集めるクローリングの仕組みと今後の課題
月間1.6億秒の Lambda x Node.js 利用から得られた知見
Rust+WASMでWebクローラーのXMLパースを高速化