ニュース | ShiranKedo

ワンクリックでネットから切断？RIPE NCCのRPKI脆弱性チェーンの全貌

インターネットレジストリであるRIPE NCCのポータルに存在した、深刻な脆弱性チェーンが報告された。XSSとCSRF、セッション管理の不備を組み合わせることで、攻撃者が標的のネットワーク経路情報を改ざんし、インターネットから切断させることが可能だった。現在は修正済みだが、インフラ基盤のセキュリティ設計の重要性を改めて示している。

Lobsters 4時間前元記事 →

たった1回変なリンク踏んだだけで、会社全体のネットが世界から遮断されるとか鬼怖くない？インフラ管理してるサイトに脆弱性があると、影響範囲がデカすぎてマジで笑えない。こういうプロトコルの境界を突くような攻撃を見つける人、頭の構造どうなってんの。修正されたからいいけど、ネットの根幹って意外と危ういのかも。

再帰的マルチエージェントシステム：エージェント間の連携を再帰的にスケールさせる

複数のAIエージェントの連携を「再帰的な計算」としてモデル化する新フレームワーク「RecursiveMAS」が提案された。エージェント間の対話をテキストではなく潜在空間で行い、繰り返し推論を深めることで、精度を平均8.3%向上させつつ推論速度も最大2.4倍に高速化した。数学やコード生成など幅広い分野で成果を出している。

arXiv 21時間前元記事 →

AIエージェント同士を何回もループさせて考えを深める仕組み、マジで進化止まらなくない？テキストでやり取りするんじゃなくて、AIにしかわからない「潜在空間」で高速に会話させるから、精度もスピードも上がるって理屈。賢いエージェントがチーム組んで超高速で思考してるとか、もう人間が追いつけるレベル超えてて草。

GitHub Copilot、6月1日より従量課金モデルへ移行　AIの“追い課金”時代の到来か

GitHubはAI開発支援ツール「GitHub Copilot」を2025年6月から従量課金制へ移行すると発表した。基本料金は据え置きだが、高度な機能の利用には「AI Credits」の追加購入が必要になる。AIの運用コスト増大に伴う収益化モデルの変更であり、開発者にとっては実質的な値上げとなる可能性がある。

はてブ 1日前元記事 →

Copilotもついに追い課金ゲーになっちゃうの？基本料金だけで使えてた機能に制限かかるの普通にキツいんだけど。高度なことやらせるとクレジット減る仕組みらしくて、これからはAI使うのもケチケチしなきゃいけないかも。開発コスト爆上がりしてて運営もしんどいんだろうけど、うちら的には財布に優しくしてほしい。

プロンプトの「あえての言葉足らず」がコードの正確性を向上させる？LLM生成の研究結果

プロンプトの具体性の欠如がAIのコード生成にどう影響するかを調査した論文。単純な課題では性能が低下するが、複雑な課題ではあえて情報を絞ることで、不要な誘導を排除し正答率が上がるケースがあることが判明した。プロンプトの構造とタスクの難易度がAIの正確性に与える影響を科学的に分析している。

arXiv 1日前元記事 →

プロンプトって詳しく書けばいいと思ってたけど、実はあえて情報を絞った方がAIが賢く動くこともあるらしい。なんか意外すぎてえぐ。下手にヒント出しすぎるとAIが変な方向に引っ張られちゃうんだって。タスクが難しい時ほど、うちらが余計なこと言わない方が正解に辿り着けるとか、AIとの付き合い方も奥が深すぎてマジでムズい。

97%の権限確認を自動化するCoding Agent用OSS「ccgate」が誕生

Claude CodeやCodex CLIなどのコーディングAIエージェント向けに、ツール実行時の権限確認を自動化するOSS「ccgate」が開発された。別のLLMが操作の安全性を判定し、安全なものは自動承認、危険なものは理由付きで拒否する。1ヶ月で約2000件の確認作業の97%を自動化し、開発効率を大幅に向上させた。

Zenn 1日前元記事 →

コーディングAI使ってると「これ実行していい？」って毎回聞かれるの、マジで作業止まってダルくない？それを別のAIに丸投げして自動化しちゃうとか発想が天才すぎ。安全そうなのはスルーして、ヤバそうな時だけちゃんと止めてくれるから安心感えぐい。これ導入するだけで開発のテンポ爆上がりするっしょ。

VPN不要！eBPFを活用して検閲（DPI）を回避する技術的アプローチ

VPNやプロキシを使わずに、Deep Packet Inspection（DPI）による通信制限を回避するツール「gecit」の仕組みを解説。eBPFを利用して、検閲装置には届くがサーバーには届かない「偽のTLS ClientHello」を送信し、装置を誤認させる。さらにパケットを細分化することで検閲をすり抜けるなど、カーネル層での高度な操作を行っている。

Lobsters 1日前元記事 →

検閲をくぐり抜けるためにVPN使うのが普通だと思ってたけど、eBPFでパケット操作して騙すとか発想が強すぎ。偽の挨拶パケットを送って検閲装置を「おけ、グーグルね」って勘違いさせるの、マジでスパイ映画みたい。カーネルレベルでこんなことできるの、エンジニアの執念を感じるし技術の無駄遣い感が最高。

MercorのAI契約者4万人から4TBの音声サンプルが流出

AI開発支援を行うMercor社のプラットフォームから、約4万人の契約者が提供した4TBもの音声データが流出した。流出したデータにはディープフェイク検出や音声解析に利用される機密性の高いサンプルが含まれている。AI学習データの管理体制や、悪用によるなりすましリスクが懸念される重大なインシデントだ。

Hacker News 2日前元記事 →

AIの学習用データが4TBも抜かれたとかマジでシャレにならないんだけど。4万人分って多すぎだし、自分の声が勝手にディープフェイクに使われるかもって思ったらガチでゾッとする。セキュリティ甘すぎたのかな。こういうの増えると、AI業界全体の信用に関わるし、マジでしっかり管理してほしいわ

Claude Codeに仕事を譲った日——残ったのは「判断」と「責任」

開発経験のないCRE担当者が、Claude Codeを活用して技術的な問い合わせ調査を自動化した事例。頻出する調査手順を「Skills」として言語化・形式知化することで、AIが自律的にDBやコードを調査し回答案を作成する仕組みを構築した。人間はAIが生成した結果の最終的な「判断」と「責任」に集中するスタイルへと業務が変化した。

はてブ 7時間前元記事 →

コード書けない営業出身の人が、AI使いこなして調査業務を全自動化したとか夢ありすぎ。単にAIに聞くだけじゃなくて、自分のノウハウを「スキル」として覚えさせるのがコツっぽい。作業はAIに任せて、人間は最後に「これで行けるか？」を判断するだけって、マジでこれからの働き方のスタンダードになりそう。

OpenAIのCEOが手掛ける本人確認サービス、ブルーノ・マーズとの「偽の提携」を発表

OpenAIのサム・アルトマン氏が手掛ける本人確認プロジェクト「World」が、歌手ブルーノ・マーズ氏との提携を事実無根のまま発表し、後に削除した。アーティスト側が提携を否定したことで、著名人を利用した不適切な宣伝手法に批判が集まっている。信頼性が重視されるWeb3分野での重大な不祥事と言える。

Hacker News 1日前元記事 →

サム・アルトマンの会社がブルーノ・マーズとコラボ！って煽っておいて、実はウソでしたとかマジで意味わかんなくない？大御所の名前勝手に使うとか、炎上商法にしてもやりすぎっしょ。AIとか本人確認とか信頼が大事なジャンルなのに、こんな適当なことやってて大丈夫なのかな。普通に引くしガッカリなんだけど。

AIオタクのセキュリティエンジニアが伝えたい、バイブコーディングのセキュリティリスク7選

AIエージェントに頼り切る「バイブコーディング」の普及に伴うセキュリティリスクを解説した記事。サンドボックス外でのコード実行や機密情報の漏洩、安全性の低い外部スキルの利用など、7つのリスクを挙げている。AIには人間のような抑止力がないため、開発者が責任を持ってリスクを管理する重要性を説いている。

はてブ 1日前元記事 →

雰囲気でコード書く「バイブコーディング」って超楽しいけど、一歩間違えるとガチで詰むから気をつけな。AIって倫理観とかないから、うちらが「これダメっしょ」って思うことも平気でやるじゃん。パスワード勝手に漏らしたりとか鬼怖いし。サンドボックス使うとか最低限の守りは固めとかないと、後で泣きを見るのは自分だよ。

AIエージェントを安全に動かすためのサンドボックス技術の比較

AIエージェントが自律的にコードを実行する際、システム破壊や情報漏洩のリスクがある。本記事では、その被害を防ぐための「隔離環境（サンドボックス）」を解説。Dockerなどのコンテナ技術から、より隔離強度の高いgVisor、Firecracker（microVM）、Wasmなどの各手法の特徴と安全性の違いを比較検討している。

はてブ 1日前元記事 →

AIに勝手にコマンド実行させるの、便利だけどPCの中身グチャグチャにされたら立ち直れなくない？だから「砂場」みたいな隔離された環境で動かすのがマジで大事。Dockerだけだと不安なケースもあるらしくて、gVisorとかFirecrackerとか色んな技術があるの勉強になるわ。セキュリティガチ勢はこういうとこまでこだわってるんだね。

AI「チャッピー」が東大・京大に首席合格、2年前の全落ちから大逆転

最新AI「チャッピー」が、2026年度の東京大学と京都大学の入試問題に挑戦し、首席合格相当の最高得点を記録した。2年前の入試では全落ちしていたが、短期間で推論能力が飛躍的に向上した。AIが高度な思考力を要する難関大学の入試で人間を圧倒するレベルに到達したことを示しており、教育のあり方に一石を投じている。

はてブ 2日前元記事 →

2年前は全落ちだったのに、いきなり首席とか伸び代えぐくない？うちもそれくらい爆速で頭良くなりたいんだけど。東大とか京大の問題って知識だけじゃ解けないはずなのに、AIがトップ取っちゃうとかマジで時代の変化早すぎ。これから受験勉強のやり方とか、マジで根本から変わっちゃいそうじゃね

CAMPFIRE 22.5万人情報漏えい — GitHub不正アクセスから何を学ぶか

CAMPFIREで発生した約22.5万人分の個人情報漏えい事件を解説。GitHubの個人用アクセストークン（PAT）が起点となり、リポジトリ内の認証情報から顧客管理システムへ侵入された可能性が高い。安易なPAT利用の危険性と、権限を限定した認証方式への移行やシークレット管理の徹底の重要性を説いている。

はてブ 3日前元記事 →

CAMPFIREの件、マジで他人事じゃなさすぎて震える。GitHubのトークン一個から22万人分のデータ抜かれるとか、セキュリティの穴って本当怖い。エンジニア的には「とりあえずPATでいいっしょ」みたいなノリが一番ヤバいってこと。権限は最小限にするのが鉄則だし、過去のコミットにパスワード残ってないかとか、マジで鬼チェックしなきゃダメじゃん。

OpenAIがGPT-5.5およびGPT-5.5 ProをAPIで公開

OpenAIは、最新のAIモデル「GPT-5.5」および上位版の「GPT-5.5 Pro」をAPI経由でリリースした。従来モデルと比較して推論能力や処理速度が大幅に向上しており、開発者はより高度なアプリケーション構築が可能になる。ChatGPTの機能拡張や商用利用の加速が期待される大きなアップデートだ。

Hacker News 4日前元記事 →

ついにGPT-5.5来たとか激アツじゃね？Pro版まであるとかOpenAIマジで攻めてる。推論とか爆速になってるっぽいし、これ使いこなせたら開発の幅広がりまくりっしょ。うちもAPI叩いてなんかエグいの作りたくなってきた。乗り遅れるのダサいから、速攻でドキュメント読み込むわ

動画生成AI「HappyHorse 1.0」が一般公開：実写からアニメまで日本語対応で生成可能に

動画生成AI「HappyHorse 1.0」が一般公開され、実写風からアニメ風まで多様な動画が生成可能になった。日本語のセリフ入力にも対応しており、プロンプト次第で高品質な映像を手軽に作成できる。AIによるコンテンツ制作の敷居を大きく下げるツールとして、クリエイターやSNSユーザーの間で注目を集めている。

はてブ 1日前元記事 →

HappyHorseっていう新しい動画生成AI、日本語のセリフもいけるとか神じゃね？実写もアニメもいけるし、クオリティ高すぎてちょっとビビる。今まで動画作るのって超大変だったけど、これならうちらでもセンスだけで勝負できそう。AIの進化マジで早すぎてついていくの必死だけど、こういう面白いツールはどんどん触っていきたい。

LocalSend：AirDropに代わるオープンソースのクロスプラットフォーム・ファイル共有ツール

OSを選ばずローカルネットワーク内でファイルを共有できるオープンソースソフト「LocalSend」が注目されている。Apple製品限定のAirDropとは異なり、Windows、Android、iOS間でシームレスに送受信が可能。プライバシー重視の設計で、ネットを介さず高速に通信できる点が大きな利点だ。

Hacker News 1日前元記事 →

AirDrop便利だけどiPhone以外に送れないの不便すぎ。LocalSendならWindowsとか泥の間でもサクッと送れるからマジで助かる。しかもオープンソースで余計な広告とかないし、セキュリティもちゃんとしてるっぽい。設定も鬼簡単だから、OSバラバラな環境で作業してる人には必須級の神ツールだと思う。

Windows 11の不満解消へ　Microsoftの最優先プロジェクト「Windows K2」とは何か

MicrosoftがWindows 11の不満を解消するために始動した最優先プロジェクト「K2」の全容が報じられた。新機能の追加より、ファイルエクスプローラーやスタートメニューのレスポンス改善など、動作の快適さと品質向上に注力する。2025年後半から順次、使い勝手の悪さを根本から修正する計画だ。

はてブ 1日前元記事 →

Windows 11ってちょいちょい動作重くてイラつくことあるじゃん。エクスプローラー開くのに時間かかるとかマジ勘弁。やっと公式が重い腰上げて、新機能よりまず使いやすさ直すって決めたのは評価する。K2プロジェクトでサクサク動くようになれば、仕事のモチベも少しは上がるかも。期待しすぎないで待ってるわ。

OSSのAIエージェントがTerminalBenchでGoogle公式を上回り首位に

Gemini-3-flash-preview上で動作する新しいオープンソースのAIエージェントが、ターミナル操作の性能を競う「TerminalBench」で65.2%のスコアを記録した。これはGoogle公式の47.8%や、既存のトップ商用モデルJunie CLIを上回る成績だ。OSSが巨大企業の公式ツールを超える性能を示した成果である。

Hacker News 2日前元記事 →

開発者が個人で作ったOSSがGoogleの公式スコアを余裕で超えちゃうとか、夢ありすぎでしょ。ターミナル操作って地味にムズいのに、そこで首位取るのはガチでつよ。これからは大企業が作ったやつをそのまま使うんじゃなくて、こういうヤバい性能のOSSを自分らで使いこなす時代になるのかもね

Chromeの「Prompt API」：ブラウザ標準のAI機能

Google Chromeがブラウザに組み込まれたAIモデルを直接呼び出せる「Prompt API」を公開した。これにより、開発者は外部のAIサーバーを介さずに、ブラウザ上でテキスト生成や要約などの処理をローカルで実行可能になる。プライバシー保護や低遅延なAI機能の実装が容易になり、フロントエンド開発の可能性が広がる。

Hacker News 2日前元記事 →

ブラウザ自体にAIが載るって、これからのWeb開発マジで変わるっしょ。サーバー代気にせずAI機能盛り込めるようになるのはデカいし。わざわざ重いAPI叩かなくていいから、サクサク動くAIアプリがもっと増えそうじゃん。ユーザー的にもデータが外に出ないのは安心だし、これ標準になったら最高だね

【Tell HN】iPhoneにアプリが毎日勝手にインストールされる怪現象

iPhoneにおいて、削除しても特定のアプリが毎日自動的に再インストールされるという不気味な現象が報告された。Apple IDの同期設定やMDM（モバイルデバイス管理）の悪用、あるいはシステムのバグの可能性が疑われている。ユーザーのプライバシーとセキュリティを脅かす深刻な問題として注目を集めている。

Hacker News 3日前元記事 →

ちょ、iPhoneでアプリ消しても消しても毎日復活するとかホラーすぎ。うちのスマホで起きたらガチで泣くわ。設定ミスならいいけど、もしハッキングとかだったらマジでえぐい。Appleさん、こういう謎現象は早めに解決してくんないと困るっしょ。セキュリティとかマジ大事だし、みんなも自分のスマホ変な動きしてないかチェックした方がいいよ。

OpenAIが「GPT-5.5」をリリース、Claude Opus 4.7を上回る性能

OpenAIが最新のAIモデル「GPT-5.5」を発表しました。競合であるAnthropicのClaude Opus 4.7を凌駕するベンチマークスコアを記録しており、推論能力やコーディング精度が大幅に向上しています。AI開発競争がさらに激化する中、実務での活用範囲がさらに広がることが期待される重要なアップデートです。

はてブ 5日前元記事 →

OpenAIがいきなりブッ込んできたね。Claudeに抜かれたとか言われてたけど、速攻で抜き返すあたりマジで王者感あるわ。性能ヤバすぎて、仕事の効率とか次元変わるレベルっしょ。うちもこれ使いこなして、無双するしかないわ。

ジュニアの採用を止めれば、シニアエンジニアに支配されることになる

経験豊富なシニアエンジニアのみを採用し、ジュニアの育成を怠る企業の危険性を説いた記事。ジュニア層の不在は、将来のエンジニア不足を招くだけでなく、既存のシニア層への過度な依存を生み、組織の柔軟性を損なう。AIが進化する現代こそ、持続可能なチーム作りのために次世代を育てる「パイプライン」の確保が重要である。

Hacker News 2日前元記事 →

即戦力ばっか求めて若手を育てないの、短期的には楽かもだけど後で絶対詰むやつじゃん。シニアがいなくなったら終わりって状況、普通に会社として詰んでるっしょ。うちの周りでも「未経験お断り」みたいなの多いけど、それだと業界全体が枯れるし、ちゃんと下を育てる余裕があるチームの方がマジでイケてると思う

Canonicalが「Ubuntu 26.04 LTS」をリリース、WSL向け新パッケージも

Canonicalは、Linuxディストリビューションの最新長期サポート版「Ubuntu 26.04 LTS」の提供を開始した。本バージョンでは、Windows上のWSL向けにTARベースの新しい配布パッケージが導入され、利便性が向上している。2031年4月までの5年間の無償サポートが保証されており、企業のインフラ基盤としての安定運用が可能だ。

はてブ 2日前元記事 →

Ubuntuの新しいLTS来たね。2031年までサポートとか、マジで息長すぎ。WSLで使いやすくなるのは、Windowsで開発してる勢からしたら普通に助かるじゃん。OSの更新って地味に面倒だけど、こういう安定版が出るとインフラ担当の人もやっと一息つける感じっしょ。うちも早めにアプデしておこうかな

200万行のテーブルにDDLを打つ前に知りたかったこと

200万行超の巨大なテーブルに対して、スキーマ変更（DDL）を行う際の注意点を解説。PostgreSQLのバージョンによる挙動の違いや、NOT NULL制約追加時のロック回避策、インデックス作成時のCONCURRENTLYオプションの重要性を実体験に基づいて紹介。DB運用における「安全な手術」の手順をまとめている。

はてブ 3日前元記事 →

200万行のテーブルいじるとか、うちなら緊張で吐きそう。何気なくカラム追加しただけでサービス止まるとか、ガチでトラウマもんじゃん。PostgreSQLのバージョンで挙動変わるのとか、知ってないと死ぬレベル。バッチで少しずつ更新するとか、そういう地道な努力がエンジニアの命を救うんだよね。本番環境でDDL打つ前は、この記事100回読んでおけって感じ。

米メタ、社員のPC操作データを強制収集しAI開発に活用

米メタが、従業員の業務用パソコンからマウスやキーボードの操作データを収集するソフトを導入したことが判明した。作業自動化AI「AIエージェント」の開発が目的だが、社員に拒否権はなく、プライバシー侵害への懸念が広がっている。AI開発の競争激化が、社内のデータ管理体制にまで影響を及ぼしている。

はてブ 4日前元記事 →

メタのこれ、社員のプライバシーとかガン無視で草。PCの操作全部抜かれるとか、うちだったらガチで病むんだけど。AIエージェント作るためなら何してもいいって感じ？便利になるのはいいけど、やり方が鬼すぎるし普通に引くわ。優秀なエンジニアとか愛想尽かして辞めちゃうんじゃね

エージェンティック・ワールドモデリング：基礎、能力、法則、そしてその先へ

AIが環境の動態を予測し、目標達成のために行動する「ワールドモデル」に関する最新の研究論文。物理、デジタル、社会、科学の4領域における制約を整理し、AIの能力を予測、シミュレーション、進化の3段階に分類するフレームワークを提案している。400以上の文献を統合し、次世代の自律型AIエージェントの設計指針を示している。

arXiv 4日前元記事 →

AIが単に言葉を返すだけじゃなくて、世界がどう動くか予測して動くとか、マジでSFの世界に近づいてきた感じ。物理とか社会のルールまで理解して行動するようになるとか、賢すぎてちょっと引くレベル。でも、こういう理論がしっかり固まっていくことで、マジで自律して動くロボットとかが当たり前になるんだろうね

DeepSeek-V4：100万トークンのコンテキスト処理を実現する高効率AI

DeepSeek-AIが、100万トークンの長いコンテキスト処理に対応した最新モデル「DeepSeek-V4-Pro」をリリースしました。GSM8KやGPQAなどの難関ベンチマークで高いスコアを維持しつつ、膨大な情報を一度に処理できる効率性を備えています。長大なドキュメント解析や複雑なタスクの自動化における実用性が飛躍的に高まりました。

Hacker News 5日前元記事 →

100万トークンとか、もはや本一冊分どころじゃないレベルで情報詰め込めるの鬼すぎ。長いコードとか資料を一気読みさせて、爆速で答え出してくれるのガチで助かるわ。DeepSeek、最近マジで勢いありすぎて、目が離せないんだけど。

パスワード管理のBitwardenがサプライチェーン攻撃の被害に、npmパッケージ利用者は確認必須

人気パスワードマネージャーのBitwardenが、依存しているnpmパッケージを通じてサプライチェーン攻撃を受けた。悪意のあるコードが混入した可能性があるため、開発者や特定のパッケージを利用しているユーザーは至急の確認が求められている。信頼性の高いツールでも、依存関係のリスクは避けられないことを示す事例だ。

はてブ 5日前元記事 →

Bitwardenまでやられるとかセキュリティ怖すぎ。npmのパッケージに罠仕込むとか、やり口が陰湿でマジで無理。パスワード預けてる場所が狙われるのはガチで詰むから、使ってる人は秒でチェックしたほうがいいよ。便利だけど、こういうリスクあるのは常に頭に入れとかないとダメっしょ

AIエージェントがMarkdownとGitで管理するKarpathyスタイルのLLM Wiki

Andrej Karpathy氏のスタイルを模した、AIエージェントが自律的に維持・更新するWikiプロジェクトが登場した。Markdown形式で記述され、Gitでバージョン管理を行うため、人間とAIの協調が容易。知識の集約やドキュメント作成をAIに任せる、新しいナレッジマネジメントの形を提案している。

Hacker News 4日前元記事 →

AIが勝手にWiki更新してくれるとか、管理の手間ゼロじゃん。MarkdownとGit使ってるから、人間が後から直すのも楽だしマジで合理的。Karpathyスタイルとか、センス良すぎて鬼。情報の整理とか一番だるい作業だから、こういうツールがもっと普及してほしいっしょ

はてな、11億円の資金流出　振り込め詐欺の疑い

株式会社はてなが、外部からの不審な指示により約11億円の資金が流出したと発表しました。従業員のアカウントが不正操作され、第三者からの虚偽の送金指示に従った可能性があるとのことです。同社は警察への協力や再発防止策の策定を進めており、顧客情報の流出は現時点では確認されていません。

はてブ 5日前元記事 →

はてなで11億とか、金額デカすぎてちょっと引くわ。振り込め詐欺的なやつらしいけど、中の人のアカウント乗っ取られて送金させられるとか、怖すぎっしょ。セキュリティガチガチにしてても、こういう隙を突かれるの、ホントしんどい。

研究の問いからワークフローを自動生成：科学の自動化に向けたエージェント型AIの活用

科学研究におけるワークフロー構築を自動化する、エージェント型AIのアーキテクチャが提案されました。LLMが自然言語の意図を解釈し、専門知識層と連携して、Kubernetes上で実行可能な再現性の高いワークフローを生成します。ゲノム解析などの複雑な処理において、精度向上とコスト削減を同時に実現しています。

arXiv 5日前元記事 →

科学の研究までAIが自動化しちゃうとか、マジで未来来てるじゃん。難しい論文とかの処理を、エージェントが勝手にワークフロー組んで回してくれるの、効率良すぎてビビる。専門家の知識とAIを組み合わせてるあたり、ガチで頭いいわ。

大規模モデルのためのLoRA再考：信号処理の視点からの分析と展望

大規模言語モデルの効率的な微調整手法として定着したLoRA（Low-Rank Adaptation）を、信号処理の観点から再定義した論文。既存のLoRA派生手法をアーキテクチャ、最適化、応用の3軸で体系化し、SVD（特異値分解）などの古典的な手法との関連性を解明。今後のさらなる発展に向けた理論的指針を提供している。

arXiv 5日前元記事 →

LoRAの理論を信号処理から見直すとか、ガチの研究者って感じ。ただの流行りじゃなくて、数学的な裏付けを固めにいくの超大事。SVDとか難しい話も出てるけど、これが分かればもっと効率よくモデルいじれるようになるんっしょ。ちょっと重いけど、AIの進化についていくならこういう本質的な話も避けて通れないよね

プロンプトが視覚を上書きする時：LVLMにおけるプロンプト誘発型ハルシネーション

大規模視覚言語モデル（LVLM）が、画像データよりもプロンプトの指示や事前知識を優先してしまい、誤った情報を生成する「ハルシネーション」の問題を調査。新たなベンチマークHalluScopeを提案し、この問題を軽減するためのファインチューニング手法HalluVL-DPOにより、視覚情報に基づいた正確な回答を促進する方法を解説。

arXiv 5日前元記事 →

AIが画像を見てるはずなのに、指示されたテキストに引っ張られて嘘ついちゃうとか、マジで「思い込み激しすぎ」って感じ。目に見えてるものが正解なのに、自分の知識で勝手に補完しちゃうの、人間でもあるあるじゃん。それを直すための新しい手法とか、AI研究もガチで進化してるよね。ちゃんと現実見て答えられるようになってくんないと、怖くて使えないし。

MCPに深刻な脆弱性：関連ソフトのDL数は1.5億件超、AIサプライチェーンに激震

Anthropicが提唱する「Model Context Protocol (MCP)」に、設計上の深刻な脆弱性が発見された。攻撃者がターゲットのシステムで任意のコマンドを実行できる恐れがあり、LangChainなどの主要AIツールを含む広範なエコシステムに影響する。関連ソフトのDL数は1.5億件を超えており、AI開発におけるリスクが浮き彫りになった。

はてブ 6日前元記事 →

AIとデータを繋ぐMCPに穴があるとかガチでやばい。これ使ってツール作ってるエンジニア超多いし、勝手にコマンド実行されたら秘密のデータとか全部抜かれちゃうじゃん。Anthropicは「仕様通り」とか言ってるらしいけど、現場からしたら不安しかないっしょ。とりあえずネットに直接公開しないとか、対策しっかりしなきゃ。

RustとRatatuiで開発モニタ「DevPulse」を自作して分かった、実用TUIの設計課題と解決策

Rust製のTUIツール「DevPulse」の開発を通じ、ポート監視やDocker管理を統合した実用的なターミナルアプリケーションの設計手法を解説している。非同期処理と同期処理の共存、高流量なログ表示の遅延回避、OS間の差異の吸収など、チュートリアルでは触れられない実践的な5つの課題と解決策を紹介する。

Zenn 4日前元記事 →

ターミナルで動くモニタをRustで作るとか、渋すぎてマジでリスペクト。Ratatuiとか使いこなしてるの、技術力えぐ。非同期の処理とかログの回し方とか、実戦でしか出てこない悩みばっかで超ためになるじゃん。うちもこういう「分かってる感」あるツール作れるようになりたいし、コード読んで勉強するわ

探索的テストを進めてくれるAIエージェントを作った

AIに単なるテスト実行を任せるのではなく、「発見・仮説・検証」という思考サイクルを回させる探索的テストエージェントの開発記録。Playwrightを活用し、過去の知見をナレッジとして蓄積することで、実行するたびにテストの精度が向上する仕組みを構築。AIが構造を理解し、深いバグを見つけ出す可能性を提示している。

Zenn 4日前元記事 →

テストをAIに丸投げするんじゃなくて、AIに「考えさせる」のってマジで天才じゃね？ただボタン押すだけなら誰でもできるけど、仮説立てて検証するって、QAのガチな仕事そのものじゃん。実行するたびに賢くなるエージェントとか、強すぎて震える。これからはAIと一緒に「ここバグりそうじゃね？」って相談しながら開発する時代が来るっしょ。

AIツールへの秘密鍵流出を防ぐ——事前チェックツール「envguard」の紹介

CursorやClaude CodeなどのAIツールを使用する際、シェルに設定された環境変数が意図せずAI側に送信されるリスクを解説しています。これを防ぐため、開発者のwinky氏が環境変数の秘密情報を一括スキャンするGo製ツール「envguard」を開発しました。AIツールの普及に伴う新たなセキュリティリスクへの対策として有効です。

Zenn 5日前元記事 →

AIにコード書いてもらうの便利だけど、AWSの鍵とか勝手に送っちゃってたらマジで笑えないわ。envguard使えば、やばい変数が残ってないか速攻でチェックできるのつよ。こういう地味だけど大事なツール、ガチで神だと思う。

AIがわずか12時間で「CPU」を完全設計。219語の仕様書から製造データを出力した新技術の衝撃

AIエージェント「Design Conductor」を用い、わずか219語の英語仕様書から12時間でRISC-V CPUの設計を完了させた事例が報告されました。論理設計から物理レイアウトまでを自律的に実行し、従来の数ヶ月かかる工程を劇的に短縮。半導体設計の民主化と高速化を加速させる画期的な技術です。

はてブ 5日前元記事 →

12時間でCPU作っちゃうとか、人間がいらなくなる速度で進化してんのヤバ。仕様書ちょっと書くだけで、あとはAIが全部やってくれるとか、もはや魔法じゃね？半導体の世界も、これからマジでAIゲーになっていくんだろうな。

Opus 4.7の登場でClaude Code開発元が提言する「もうやめるべき6つの習慣」

Anthropicの最新モデル「Claude 3.5/4.7 Opus」の性能向上に伴い、公式開発チームがAIによるコーディングにおける古い手法を否定する提言を行った。モデルの知能が上がったことで、過度なプロンプトエンジニアリングや細かな指示が逆に効率を下げる可能性を指摘。AIとの向き合い方の転換を促している。

はてブ 5日前元記事 →

モデルが賢くなりすぎて、今までのやり方が通用しなくなってるのウケる。細かく指示しすぎるのが逆に邪魔とか、Opus 4.7つよすぎ。人間側がアップデートできてないの、ちょっと恥ずかしくない？これからはAIに丸投げするセンスも大事になってきそうだし、うちも頭切り替えるわ

AIの成果物に責任を取る方法

AIが生成したコードにバグがあった場合、責任はマージした人間にある。AIを「部下」として捉え、プロンプトによる教育とLinter等のガードレールによるマネジメントの必要性を説く。単なるバグ修正ではなく、なぜAIが間違えたかを分析し、システム全体をチューニングする「AI時代のエンジニア」の在り方を論じている。

Zenn 5日前元記事 →

AIがミスったのをAIのせいにするのはダサいって話、マジ納得。結局、マージボタン押したの自分じゃん？ってことっしょ。AIを使いこなすには、ただ指示出すだけじゃなくて、環境作りとか教育が超大事。若手はAI任せにしすぎると経験値たまんなくてヤバいかもだけど、逆にAIのマネージャーとして成長するチャンスでもあるよね。思考停止しないで使い倒そ。

Appleが警察による削除済みメッセージ復元を可能にしていたiPhoneのバグを修正

Appleは、iPhoneやiPadにおいて削除済みまたは自動消去されたメッセージが警察などの法執行機関によって抽出可能だった脆弱性を修正した。通知内容がデバイス内のデータベースに最大1ヶ月間キャッシュされていたことが原因。この問題はFBIがSignalのメッセージを復元したことで発覚し、重要な修正となった。

Hacker News 6日前元記事 →

削除したはずのメッセージが警察にバレるとかマジで怖すぎ。通知の履歴がこっそり残ってたとか、Appleでもそんなミスあるんだね。Signalの社長がブチ切れてAppleに詰め寄ったおかげで直ったっぽいけど、プライバシー守るのも楽じゃないわ。iPhone使ってるなら速攻でアプデしとかなきゃ詰む。

脆弱性発見のためのマルチエージェント・ハーネスの自動合成

AIエージェントを用いて未知の脆弱性を発見する新手法「AgentFlow」が提案された。エージェント間の通信や役割分担を定義する「ハーネス」を自動最適化することで、人間の手動設定を凌駕する性能を実現。Google Chromeで10件のゼロデイ脆弱性を発見しており、AIがサイバーセキュリティの最前線で実用的な成果を出した事例だ。

arXiv 6日前元記事 →

AIがChromeのバグを10個も見つけたとか強すぎ。しかも人間がやるより効率いいとか、もうセキュリティの仕事もAIにお任せする時代じゃん。エージェント同士をどう連携させるかまで自動で考えるとか、技術の進歩えぐい。これからは「AIをどう使いこなして守るか」がマジで重要になってくるんだろうな。

OpenAI、漫画や広告に強い画像生成AI「ChatGPT Images 2.0」正式発表

OpenAIが発表した「ChatGPT Images 2.0」は、従来の「綺麗な絵」から「伝わるグラフィック」へと進化した。特に日本語を含む多言語のテキスト描写が大幅に改善され、漫画や広告、UIモックの作成が容易になった。Thinkingモデルとの連携により、Web検索や複数案の自己修正も可能になり、実用性が飛躍的に向上している。

はてブ 7日前元記事 →

OpenAIの新作、画像の中に日本語がガチで綺麗に入るようになったのヤバくない？今までのAI画像って文字がグチャってて結局人間が直してたけど、これならマンガとかバナーも一発でいけそう。しかも自分で考えて修正案出してくるとか、もはやデザイナーの相方じゃん。これ使いこなせれば制作の効率鬼上がりっしょ。

Tolaria：Markdown形式のナレッジベースを管理するmacOS向けオープンソースアプリ

macOS向けの新しいオープンソースアプリ「Tolaria」が登場しました。Markdownベースのナレッジベースを効率的に管理するためのツールで、シンプルかつ高速な操作感が特徴です。GitHub上で公開されており、開発者やライターが個人のドキュメント管理や知識の整理を行うのに最適なツールとして注目されています。

Hacker News 5日前元記事 →

Markdownでメモ管理できるアプリ、地味に探してたんだよね。Tolariaはオープンソースだし、Mac専用で動きも軽そうだから、うちのナレッジ整理にちょうど良さそう。こういうシンプルで使いやすいやつが、結局一番長く使うんだよね。

「AIを使えば全員同じになる」羽生善治九段が語るAI時代の差別化と意思決定

将棋界のレジェンド羽生善治九段が、AI時代の意思決定について語った。AIによる最適解の提示は、全員が同じ戦略をとる「同質化」を招くと指摘。その中で差別化を図るには、あえて評価値の低い手を選ぶ勇気や、AIの評価が分かれる局面での人間らしい判断が重要になる。技術を使いこなしつつ、自らの意志を込めることの価値を説いている。

はてブ 6日前元記事 →

羽生さんの話、深すぎて鬼刺さる。みんながAIの正解ばっか追いかけたら、個性が消えて全員同じになっちゃうってマジでその通り。結局、最後に何を選ぶかは自分の意志だし、あえて「正解じゃない方」に行くのが人間らしさってことっしょ。効率だけじゃないクリエイティブな視点、うちらも忘れたら終わりだわ。

マイクロソフトの新IME「Copilot Keyboard」が正式版に：あの「カイル君」も復活

日本マイクロソフトは、AIアシスタントを統合した新しいIME「Copilot Keyboard」の正式版をリリースした。プレビュー版から動作速度と安定性が大幅に向上し、WordやExcelなどのOfficeアプリとシームレスに連携する。また、かつてのヘルプキャラ「カイル君（イルカ）」がAIエージェントとして復活したことも大きな話題となっている。

はてブ 6日前元記事 →

あのイルカ、まさかの復活とかエモすぎ。昔のキャラが最新AIになって帰ってくるとか、Microsoftも粋なことするじゃん。タイピングしながらそのままAIに実行をお願いできるの、マジで作業捗りそう。カイル君、うちらの世代は知らない子も多いかもだけど、キャラデザ可愛いし普通に推せる。

PlayCoder：LLMが生成したGUIコードを「遊べる」状態にするフレームワーク

LLMによるGUIやゲームのコード生成は、コンパイルが通っても論理的なエラーで動かないことが多い。これを解決するため、リポジトリを意識したベンチマーク「PlayEval」と、AIエージェントが実際に操作してバグを検知・修正するフレームワーク「PlayCoder」が提案された。従来のパス/フェイル評価を超え、対話的な動作の正確性を追求している。

arXiv 7日前元記事 →

AIにゲーム作らせても「コードは合ってるのに動かない」みたいなの、あるあるすぎてダルいよね。PlayCoderはそこをAIエージェントが実際に遊んでチェックして、バグがあったら自分で直すっていうループを回すらしい。これならマジで「遊べる」レベルのものがサクッと作れそう。AIがテストまで担当する時代、もうそこまで来てるわ。

RobloxのチートツールとAIツールが原因でVercelのプラットフォームが侵害

Robloxのチートツールに仕込まれたマルウェアが、AI企業Context.aiの従業員を経由してVercelへ波及した。Vercelのエンジニアが当該AIツールに業務アカウントで広範なOAuth権限を与えていたことが原因。機密環境変数は無事だったが、一部の環境変数が流出し、攻撃者が身代金を要求する事態となった。

Hacker News 2026-04-21 元記事 →

RobloxのチートツールからVercelまで繋がるとか、マジで予想外すぎて草。エンジニアが適当にOAuth連携ポチっちゃうの、ぶっちゃけ他人事じゃないっしょ。仕事用のアカウントで怪しいAIツール触るの、ガチでリスク高いって分かったわ。環境変数は守られたっぽいけど、これからはもっと慎重にならないと詰む。

「Firefox 150」正式版リリース：Anthropicの「Mythos」モデルで脆弱性を一掃

Mozillaは「Firefox 150」を正式公開した。最大の特徴はAnthropicの最新AIモデル「Mythos」を活用し、膨大な数の脆弱性を修正した点にある。機能面では、タブの分割ビューやローカル環境での翻訳、PDF編集機能の強化が図られた。AIによるセキュリティ向上と利便性の両立を目指した大型アップデートとなっている。

はてブ 7日前元記事 →

Firefoxが150まで来たの凄。しかもAnthropicの最強AI使ってバグとか脆弱性を一気に片付けたとか、セキュリティへの気合いがえぐい。ブラウザだけで翻訳もPDF編集もサクサクできるようになったし、分割ビューも地味に便利じゃね？AIの力でブラウザがどんどん進化してくの、マジで時代の変化感じてビビるわ。

GitHub Copilotが2026年から制限導入へ、コスト増大によりトークンベースの課金方式へ移行か

GitHub Copilotの運用コストが2026年1月以降に急増したことを受け、GitHubが課金体系の変更を検討している。これまでの定額制から、利用量に応じたトークンベースの課金へ段階的に移行する可能性が浮上した。開発者の生産性を支えるツールのコストモデルが変わることで、今後のAI開発環境に大きな影響を与える。

はてブ 2026-04-21 元記事 →

Copilotまで課金厳しくなるとか、マジで世知辛いんだけど。今まで使い放題だったのがトークン制になるかもって、開発のやり方ガチで変わるじゃん。AI回すのにも金かかるのは分かるけど、制限かかるとモチベ下がるっしょ。便利すぎて依存してるから、値上げとか制限は正直かなりきつい。

ワンクリックでネットから切断？RIPE NCCのRPKI脆弱性チェーンの全貌

再帰的マルチエージェントシステム：エージェント間の連携を再帰的にスケールさせる

GitHub Copilot、6月1日より従量課金モデルへ移行 AIの“追い課金”時代の到来か

プロンプトの「あえての言葉足らず」がコードの正確性を向上させる？LLM生成の研究結果

97%の権限確認を自動化するCoding Agent用OSS「ccgate」が誕生

VPN不要！eBPFを活用して検閲（DPI）を回避する技術的アプローチ

MercorのAI契約者4万人から4TBの音声サンプルが流出

Claude Codeに仕事を譲った日——残ったのは「判断」と「責任」

OpenAIのCEOが手掛ける本人確認サービス、ブルーノ・マーズとの「偽の提携」を発表

AIオタクのセキュリティエンジニアが伝えたい、バイブコーディングのセキュリティリスク7選

AIエージェントを安全に動かすためのサンドボックス技術の比較

AI「チャッピー」が東大・京大に首席合格、2年前の全落ちから大逆転

CAMPFIRE 22.5万人情報漏えい — GitHub不正アクセスから何を学ぶか

OpenAIがGPT-5.5およびGPT-5.5 ProをAPIで公開

動画生成AI「HappyHorse 1.0」が一般公開：実写からアニメまで日本語対応で生成可能に

LocalSend：AirDropに代わるオープンソースのクロスプラットフォーム・ファイル共有ツール

Windows 11の不満解消へ Microsoftの最優先プロジェクト「Windows K2」とは何か

OSSのAIエージェントがTerminalBenchでGoogle公式を上回り首位に

Chromeの「Prompt API」：ブラウザ標準のAI機能

【Tell HN】iPhoneにアプリが毎日勝手にインストールされる怪現象

OpenAIが「GPT-5.5」をリリース、Claude Opus 4.7を上回る性能

ジュニアの採用を止めれば、シニアエンジニアに支配されることになる

Canonicalが「Ubuntu 26.04 LTS」をリリース、WSL向け新パッケージも

200万行のテーブルにDDLを打つ前に知りたかったこと

米メタ、社員のPC操作データを強制収集しAI開発に活用

エージェンティック・ワールドモデリング：基礎、能力、法則、そしてその先へ

DeepSeek-V4：100万トークンのコンテキスト処理を実現する高効率AI

パスワード管理のBitwardenがサプライチェーン攻撃の被害に、npmパッケージ利用者は確認必須

AIエージェントがMarkdownとGitで管理するKarpathyスタイルのLLM Wiki

はてな、11億円の資金流出 振り込め詐欺の疑い

研究の問いからワークフローを自動生成：科学の自動化に向けたエージェント型AIの活用

大規模モデルのためのLoRA再考：信号処理の視点からの分析と展望

プロンプトが視覚を上書きする時：LVLMにおけるプロンプト誘発型ハルシネーション

MCPに深刻な脆弱性：関連ソフトのDL数は1.5億件超、AIサプライチェーンに激震

RustとRatatuiで開発モニタ「DevPulse」を自作して分かった、実用TUIの設計課題と解決策

探索的テストを進めてくれるAIエージェントを作った

AIツールへの秘密鍵流出を防ぐ——事前チェックツール「envguard」の紹介

AIがわずか12時間で「CPU」を完全設計。219語の仕様書から製造データを出力した新技術の衝撃

Opus 4.7の登場でClaude Code開発元が提言する「もうやめるべき6つの習慣」

AIの成果物に責任を取る方法

Appleが警察による削除済みメッセージ復元を可能にしていたiPhoneのバグを修正

脆弱性発見のためのマルチエージェント・ハーネスの自動合成

OpenAI、漫画や広告に強い画像生成AI「ChatGPT Images 2.0」正式発表

Tolaria：Markdown形式のナレッジベースを管理するmacOS向けオープンソースアプリ

「AIを使えば全員同じになる」 羽生善治九段が語るAI時代の差別化と意思決定

マイクロソフトの新IME「Copilot Keyboard」が正式版に：あの「カイル君」も復活

PlayCoder：LLMが生成したGUIコードを「遊べる」状態にするフレームワーク

RobloxのチートツールとAIツールが原因でVercelのプラットフォームが侵害

「Firefox 150」正式版リリース：Anthropicの「Mythos」モデルで脆弱性を一掃

GitHub Copilotが2026年から制限導入へ、コスト増大によりトークンベースの課金方式へ移行か

GitHub Copilot、6月1日より従量課金モデルへ移行　AIの“追い課金”時代の到来か

Windows 11の不満解消へ　Microsoftの最優先プロジェクト「Windows K2」とは何か

はてな、11億円の資金流出　振り込め詐欺の疑い

「AIを使えば全員同じになる」羽生善治九段が語るAI時代の差別化と意思決定