これがちゃんとできると、データシートもらってから 3D CAD 内でのフィットチェックであったり 3D プリントして組み立て性を確認したりするやつがだいぶラクになるんですよね。特に最近の 3D プリンタはメンテフリーで安定した造型を高速に行うことができますし、ものによっては自動でスライスしたりジョブ投げたりもできるので、やろうと思えば人間は「**のモデル作って刷っといて」とエージェントに言って、プリント完了通知がきたらビルドプレートからモデルを剥がすだけ、みたいな体験も作れそうです。
ちなみに、データシートとかは Google Drive に突っ込んでおくと、最近だと Google Workspace CLI でファイル検索してダウンロードさせて読ませる、とかもできて便利ですね。まあシンプルに検索とダウンロードができればなんでもよくはあるんですが。仕事だとメールも読ませられるのも結構便利ですね。メール下手人間なんで。
Google Workspace CLI で Claude Code にデータシートやらメールのやりとりやらを漁らせてドキュメントとか書くの、かなり便利かもhttps://t.co/0FTDKTfPgw
これは単にやってみた以上のことはないですが、ナイーブな軌道計算です。
ただこういう複数の天体の重力を受けるようなある程度長時間の計算って、雑にやるのはそんなに難しくないんですが高精度にやるのは結構難しいので、ある種のベンチマークとしてよいなと思っています。
そして NASA がデータを公開しているので評価もしやすいです。
ちなみに CI はこんなことになっています。
test がたくさんあるということは、Actions の実行時間が増えるということ
さいごに
Claude Design がリリースされたので、Opus 4.7 に orts のロゴを作ってもらいました。
Orbit とオーツ麦の言葉遊びです。
orts logo
また、今回ちゃんとリリースしたのは趣味でやっていたつもりが十分以上に実用的になってしまったので仕事で使いたく/同僚に使ってほしくなってしまったからです*8。マトモで使いやすいシミュレータ(プラットフォーム)が全然無いというのは正直この4年以上ずっと困っていた問題だったんですよねえ。そしてなぜ長いこと(完全には)解決できていなかったのかと言えば、シミュレータを「ちゃんと」作るのってすごい面倒だからなんですよね。言い訳ですがモノを作ったりチームを作ったりしていると時間が溶けがち。そういった問題が主に Opus 4.6 の腕力で解決したのは本当に便利でした*9。
そして、色々書いたもののまだだいぶ荒削りなので、今後も引き続き開発していければと思います。というかたぶん必要なのでします。よかったら star とかしてくれるとうれしいです。
*4:"HILS" とかいう、より何も言っていない、なんの責務も明らかでないし人によって思い描いているものがまったく違う、結果として結局何をなんのためにどのように検証したかったのかもよくわからないまま曖昧に謎のモジャモジャの通信線がたくさん PC に繋がりまくって「ループが回って......ループが回るとうれしい!」みたいなことになっていることがしばしばある最悪の言葉もあります。駆逐したい。この世から一匹残らず。
このタイミングから、僕は共有の Google drive を整理して議事録作ったりとかロジ寄りのことをするようになっていました。
あと、元の3人だけだと当日の運営やネットワーク敷設などの調整がつけられないので、適切な現役生(現在の大学の技術的側面やその調整先に精通ないし所属している休学ないし事実上の休学を繰り替えしたりしていないものを指す)を見繕って巻き込むなどしていました。
*1:僕は普段の日常生活では基本的にまったくといっていいほどアルコールを摂取しないんですが、飲酒自体はそこそこの量が technically possible ですし、飲むか飲まないかに関わらず概念としての懇親会ないし飲み会はかなり好きな方なので適宜誘ってもらって全然 OK です。脚注で表明することなのか?これ
そんな僕ですが、SOLAR LINE はちゃんと楽しむことができました。太陽系内の惑星から惑星(たまに衛星)へ次々と軌道遷移していくテンポの良さと、その際の違和感の無い物理的な描写のバランスが取れていてとてもよかったです。各所にふんだんに出てくる数値も、パッと見では条件さえ整えばオーダーは合っていそうに思えます。
自分でやってみてもよかったんですが、最近はやっぱりエーアイが便利です。
そして何よりエーアイは Web 開発がかなり得意なので、自分で何か検証みたいなことをする時も、最近はもっぱら横に Claude Code を置いてリアルタイム可視化のための Web app を同時に作る、みたいなことはかなり日常的になっています。
他に意識していたことは、LLM は直接動画を読むことはできないということです。
VLM みたいなものを頑張ればあるいは、ということはあるかもしれませんが、いずれにしろその分野はまだまだという印象があるのと、一方で「言語」の世界にさえ落ちてしまえば今の frontier model の性能ならかなりの情報を察することができるだろうなという感覚があるのと、単純に手元に Claude Max subscription があるのでそれぐらいしか手段が無いためです*3。
そのため、最初に動画からの文字起こしをさせることにしていました。
一方で、こういった追加指示は端的な方向性のみ指示して設計は Claude に任せるスタイルだとどうしてもイマイチな印象も正直ありました。
というかまあ、分析の中身とか可視化のやり方については結構な頻度で具体的な追加の指示を突っ込んでいました。なので全自動というのは実態としてはかなり FAKE です。
普段のやり方との差分を考えると、じっくり plan してから作業とかしていないのでまあそうかなとは思いつつ、じゃあどうするとよいのかまではあんまり見えてないです。AskUserQuestion をいいかんじにファイル化して適当な非同期インターフェースで聞きつつ、情報が集まるまでは他のタスクを実行する、ぐらいのループの制御はするといいんですかねぇ。
で、どうなったかというと、2~3日で 200 USD Max の weekly rate limit が売り切れました。かなしい。
Anthropic 社員には rate limit とかなくてこういう実験をしやすくてズル(それはそう)
You've hit your limit
微妙に関係ないですが、Opus 4.6 fast とかはああいう社内での色々な実験のフィードバックループ速度を上げるのに便利なんだろうなと思うなどもしました。
しかし、自動分析という今回の実験自体にはまだまだ課題はあったものの、SOLAR LINE 自体の描写の正確性はやはり高いなとやりながらも感じていました。もちろん、ものすごく複雑な軌道設計とかがあるわけではないですし、規模の都合上かなり惑星の位置関係の都合が良さそうな想定ではあるなとは思ったものの、専門でない人間がナイーブに考えたらよくやるようなミスというか、詰めの甘さみたいなものは感じず、結果として自動分析自体のデバッグもしやすくて便利でした(分析レポートを読んで違和感を覚えたら分析側が大体おかしい)。
*1:正確にはガンダムは最近水星の魔女とジークアクスは観ました。ゆえぴこさんの更新待ちの間に AbemaTV の無料公開期間とかで......あと後者はタイムラインでの連日のネタバレ合戦がウザすぎて......でも結局 not for me かなあとは思いました。わざわざ言うことでもないんですが。
*2:これは用途や使う人によっても印象が分かれているところではあると思いますが、GPT 系は勝手にすべてを一撃でやり切ろうとするのでフィードバックループの構築には明らかに不向きで、それは human in loop みたいな場合でもそう、という印象が強いです。あくまで「回答」を生成する対話のために訓練されており、問題解決能力はあまり無いという印象です。ここまで LLM が盛り上がって競争が激化して、各社のモデルが似たようなところに収斂するのではなく明確に「個性」が出る方向になっているのは面白いなと思っています。
*3:GPU は RTX 3090 一枚ぐらいしかないので、最近また多少盛り上がりがあるとはいえ Local LLM でやるのはまだしんどいです
Google map のタイムライン機能が事実上死んで悲しかったです。
気分によってはプライバシーにかなり気持ちがあるのでクラウドにこんなにプライベートなデータが保存されてほしくない、それが勝手に使われてほしくないという気持ちはすごく分かります。
ただ、すごく分かるからこそ、そういった気持ち悪さやリスクより使いやすさというメリットを取って使っていたので、そんなにどっちつかずな物体になられると困る。
ArkEdge Space Inc./筑波大学のsksat氏による「探査機自作ゼミ」です。模擬的な惑星探査機の自作を通して、複雑なものづくりへの立ち向かい方を、受講生全員でひとつのチームになって体感します。短期間で慣れない組み込みシステム開発に開発のやり方そのものを考えながら取り組みました。#seccamppic.twitter.com/xj9YnlDnx1
しかし、組み込み開発はまだそこまでできるというわけではありませんでした。
これはモデルの学習データが少なかったり、モデルの問題解決能力の性能の問題ももちろんありつつ、組み込み開発ってコンテキストが絶対にローカル PC 内だけに収まらないので、LLM を活用する場合、如何に適切なコンテキストを人間が解釈・選択して LLM に渡すかが Web 開発の比ではないくらい重要になるんですよね。
よくあるのが、食事を疎かにして QoL が下がって家もゴタついてメンタルもゴタつく、というやつです。
今年はチームやエーアイの進歩によってできた隙間を勿体ないと言いながら埋めまくる、みたいなムーブをしてたまに破綻していました。
人間はパターン学習器なので、典型的なパターンには典型的なパターンで、ということで、「こういう状況下に陥ったらとりあえずこうする」みたいな最悪回避ルーチンを設計しておかないとな、と思います。