Opus4.6とClaudeCode運用戦略

今朝未明、Claude Opus 4.6がリリースされた。Sonnet 5リークとはなんだったのか。まあいい。Opus 4.6に対応しよう。

詳しい数値とかは有識者の方にお任せするとして、こちらに関係するものだけ。
注目していた1MコンテキストウィンドウはベータかつAPI直接のみで、Claude Codeからは使えない。200K固定のまま。かなり残念。一方でDev Agents(Agent Teams)やSubagentのメモリ機能は面白い。Subagentにmemoryフィールドを持たせ、MEMORY.md作る。これでセッション横断の秘伝のタレができる。使いこなさないとありがたみはわからないだろうけど、ワクワクする。

大雑把に機能確認をしたところで、LAM( https://github.com/sougetuOte/LivingArchitectModel )のメモリ戦略を見直した。

最近問題としているのは圧縮処理だ。残りが少なくなってるのを認識した時点でセーブ処理を行い、セッションの切り替えをするのだが。SerenaとDailyコマンドを併用し、コンテキストの約7-8%を消費している。200Kの8%は16Kトークン。これは痛い。また、serenaはCLAUDE.mdで明示的に指示しないと、grepで済ませてしまう傾向があるらしい。セーブ処理でトークンを消費しても、セッション時にはあまり使われていない可能性がある。私のプロジェクト規模(個人開発、全体像が頭に入る程度)では、Serenaの恩恵自体が薄いのかもしれない。

serenaを常駐させるだけでコンテキストを圧迫するので、対策を考える。まずは、セッションのセーブ処理だけを目的とした軽量な/quick-save(SESSION_STATE.mdのみ、3-4%)と、フルセーブ(SESSION_STATE.md + git commit & push + dailyコマンド)に分離する方針を立てた。作業セッションのコンテキストを開発に全振りするという考え方。StatusLineでコンテキスト残量を常時監視しつつ、残り15-20%を切ったらquick-saveでセッションをexitする。クイックセーブについては恐らく10%程度から実行すれば十分だと思うが。そうすれば、auto-compactに怯えなくて済む。serenaの常駐を止めればコンテキストを運用に使える量が増える。より余裕を持って使えるようになるだろう。

まだ机上の空論だが、固い戦略だと思うので恐らく外すことはなかろう。まずは、StatusLine導入から実際に試していく。

プログラミング教育のAI時代への転換 ―『書く技術』から『導く設計』へ―

ソフトウェアの作成がAIツールによってソースコードの作成からアーキテクト、マネージメントに移りつつ有る。
それに伴い現在のプログラミング初等教育は、ある種の岐路に立たされていると感じる。初学者が学ぶ「低レイヤーな基礎」と、実務で行う「AIを動かすための高レイヤーな設計」。この乖離を埋める鍵は、開発における「ガードレール」の捉え方にあるのではないか。

これからの教育は、これまでと違うアプローチが必要だ。第一段階では、AIツールベンダーが用意しているガードレールを活用し、プログラム作成の成功体験を与える。バイブコーディングの波に乗り、まずはとにかく完成品を積み上げること。この成功体験を通じて、ソフトウェアの作成の全体像を体感させる。これは、今までの初心者教育には出来なかったことだ。これだけでもこれまでの教育方法を刷新する価値がある。
そのうえで、標準の与えられたガードレールでは不足が生じた段階になれば、ガードレール(設計図)を自ら設計する必要性を気づかせる。

自分でガードレールを引くためには、結局のところ、コンピュータがどう動くかという基礎的な理解が欠かせない。C言語やPythonの初歩を教える意味は、実装力を養うためではなく、AIに与える指示の妥当性を判断し、構造を破綻させないための「鑑識眼」を養うことに集約される。教育を否定するのではなく、出口を「設計」へとシフトさせる。それが私の考える、新しい時代の初等教育の姿だ。

では、書けない技術者についてどう考えるのか。これは作成のレイヤーが変わったと捉えるしかないのだろう。我々だってアセンブラは書けないのだから。

バイブコーディングのその先で

おはようございます。

結局、Claude Sonnet5は来ませんでしたね。夜中に起きた時にチェックしてみたんですが、Xのトレンドに上がってなくてがっかりしました。

昨日は年度末特有のドタバタでした。プログラムについてはほんの少ししか触ることができず、残念でした。

私はClaudeCodeを使ってプログラムを作成していますが、自分のプロジェクトに限って言えば、ここ数ヶ月まともにソースコードを見たことすらありません。LAMによるガードレールを作り、テスト計画を立て、リファクタリングや実際の使用してのユーザーテストなどをやることで、片がついてしまうからです。細かいところの最適化についてはいろいろあるんでしょうけれども、使用していての問題は特にありません。

私の場合は計画を立てたり構造を考えたりするのは好きなんですが、コーディング能力というといまいちです。なので、私の場合バイブコーディングを行うのがかなり性に合っています。今やバイブコーディングというより、何なんですかね、このプロジェクトの作り方は。実際全然コーディングしてないので、これはプロダクトと言うべきなのか何なのか。

この作り方が標準的になってくるのであれば、現在よりもコーディングの職人的なところが排除されていき、工芸品より工業的になっていくのではないかと思います。大規模なプロジェクトについては作り方は知らないのですが、中規模・小規模となってくると、どうしてもメンバーの俗人性というのが反映されてしまいます。設計や指示の仕方などを統一していけば、ClaudeCodeなどのツールが一定の水準で物を作り込んでくれる。そういう風になるのではないかなと考えています。

Sonnet5の噂とLAMの更新

昨日2月2日、AnthropicのClaude Sonnet 5リリースのリークが出た。そのリークを信じるのであれば、明日未明、2月4日未明にリリースされるはずだ。様々なアップデートが、その中にサブエージェントなどにチームを組ませるという項目があった。嬉しい反面、気になるところが出てくる。

私が現在利用している自作ソフトに「LivingArchitectModel」というものがある。これは一言で言うなら「Claude Code のための行動規範フレームワーク」だ。cc-sddやspec-kitみたいなもんだと思ってもらえば良い。今作っているソフトはこの LivingArchitectModel をテンプレートとして作っている。

そして現在ちょうどこのLAMについて大規模なアップデートをしようと考えていた。何かというとサブエージェントのチーム化だ。つまり、このリーク記事のSonnet5としっかり被ってしまうというわけだ。先日、ClaudeOpusの4.5に、「agent swarm」の記述があったという話も記憶に新しい。なんにせよ、エージェントのチーム化というのはホットなキーワードである。

私のような一般人が作るより、Anthropicの最高の技術者たちが作った方がいいに決まっているし、標準化されているものを使うのはいいテクニックだ。私はしばらく待つことにした。

ネット上のアナリストによると、Opusが出てまだ10週間しか経っていない。Anthropicがここで新しいモデルを出すのは彼らのやり方に合わないという。確かにそれはある。ただ、それは周囲の状況を見て考えるとそうでないかもしれないと言える。

Gemini3Proが出てからのOpenAIの動きを考えてみてほしい。レッドアラートが出て、そしてすぐに5.2が発表された。それからもGoogleはGeminiを様々なサービスと組み合わせようとしている。Google ChromeとGeminiの一体化というのもまた一つある。そこでnano bananaが使えるというのは恐ろしい話だ。

そういう状況を考えると、Anthropicが彼らのやり方を破る可能性は十分にある。swarmにしても今回のリークにしてもそのマーケティングに当たるものかもしれない。

まあ何にせよ、私にできることはほんの少し待つだけだ。

焦る日々

早いものでもう2月である。

私は単年度契約の講師がメインの収入なのであるが、来年度はかなり授業が減りそうなのである。ここ数年はほぼ講師の収入に頼っていたため、非常に不安を覚えている。

性格的に営業ができる人間ではない。どうしたらよいかAIに相談などもしてみるのだが、これといったいい手が見つからない。

その中にはudemyやココナラなどで講師としての腕を使い、動画などを公開してはどうかというのもあった。なかなか気が進まないのがこれも一つの手段として考えておくべきだろう。

もう一つ考えているソフトウェアの作成。AIを使っていろんな人がより簡単にソフトウェアを作ることができるようになったが、一定以上の完成度を保つためには、やはりプログラミングの知識、広範な設計の知識が必要だ。一応自分も講師以外でもいくらか普通のプログラムを作ったことがある。それで何かできないかと考えているのがもう一つだ。

例年2月3月4月は授業がないため耐える時期なのであるが、なんとかしてこの間にものになるものを一つでも作っておきたい。月に2、3万でもだいぶ違う。3、4万、できれば5万などと、取らぬ狸の皮算用を考えているのだが、果たしてどうなるやら。

ComfyUIでひどい目に有った話

今朝はいつもより早く起きたので、ちょっとお絵かきでもしてみるかということで、ComfyUIを立ち上げた。私のお絵かきはAIと自分で描くのを混ぜ混ぜしているので、ComfyUIが必要なんだ。

で、まあ、ターミナルを見ていると、いつも気になるエラーというかワーニングがあって、これどうにかならんかなと思った。あともう一つ、Xformsというライブラリを入れられないかなと思った。じゃあ修正してみようか。これがいけなかった。

ChatGPTとお話ししながらやっていき、おおよそうまくいった。それでもまあ3時間ぐらいはかかったのかな。で、最後に開発してた環境とこれまで使っていた環境を入れ替えてみる。そうすると、なんということでしょう。全然動かない。何が悪いかも最初わからず、あたふたあたふたとする。やっているうちにだんだんと話がややこしくなっている気がするなぁとなった。集中力も落ちている気がする。

これはAIと作業を進めるときのまずいパターン。AIは一つのことに集中するあまり視野が狭くなる。どう見ても無理筋なことをどんどんどんどん詰めていくので、環境調整なんかの場合はかえってまずいことになったりする。今回はそれだ。

見切りをつけた私はそこからもう一回新しく環境を作り直すことにした。そこまでのログがあるので、楽に進めるかなと思ったのだが、あまりにもログが長いため、ChatGPTもうまく道筋を探しきれないようだった。

まあそれでもなんとかかんとか動くようになって、気がついたらもう12時。半日完全に潰したことになる。最終的には当初見込んだワーニングは取り去ることができたし、Xformも無事動くようになったのだが、今また別の何かが出ている。これもこれまでの作業の際に取り除いた覚えはあるのだが、ChatGPTが頻繁にフリーズするようになったので、一回このスレッドを諦めることになった。

スレッドを捨ててしまえば、次の時には記憶が引き継げない。元のスレッドでまとめを作ってもらってもいいんだが、それでもやはり長くなるだろう。

今回はとりあえず自分で思ったことをメモに残し、次回やる気になったときにChatGPT、Gemini、Claudeのどれかと一緒に作業を進めようと思う。

逆向き瞑想 昼寝

今朝も昨日の日記を書こうとしたのだけれども、なかなかネタが思いつけないので、逆向き瞑想というのをすることにしてみた。

別に特別なことをするわけではない。遡りたいことをずっと考えていって、考えていって、考えていって、心を鎮める、それだけ。探しているものが見つからないときに、自分がどこを動いてどうだったっけ、みたいなのをどんどんどんどん遡って考えるのと同じようなもんだ。

まあ、今私は実際にそのネタを探そうと思っていろいろやっているので、瞑想というのとは違うのかもしれない。

そうして考えてみると、昨日は残念なことがあったのを思い出した。

外での仕事は午前中で終わったので、昼食を取って帰宅。デグーのゲント君のケージを掃除してあげて、そしてちょっと疲れたなと思って昼寝をした。これがいけなかった。2時間ほどして目が覚めた。タイマーをつけてなかった。起きたら体がすごくだるい。

結局その後、だるさ、きつさで何もしないままに晩御飯も手抜きにしてしまい、そして寝た。完全に無駄にした感。

昼寝というか、仮眠は長く取りすぎるとダメっていう話があるんだけれども、まさにそれをやってしまった感じ。

というわけで、ネタがないなぁと思って逆向き瞑想(?)を試してみたら、昨日のことを思い出したよという話でした。

花粉症の薬が投入される。

しばらく前から目が痒くて、目やにが出ているような感じがしていた。目頭のところが何かパサついているような感じがして、汚れているような感じがして、ハンカチやらタオルやらで拭くんだけどなかなか取れなくて、手で書いては何か切れてしまって血が流れるみたいな感じ。

まあぶっちゃけ花粉症なんだろうなということになった。まだ1月なんだけどね。最初に痒くなった日とかをチラッと思い出すと、1月の半ばぐらいからだった。いや、まだ真冬だぞ。1月半ばってどういうことって感じだよね。花が咲いてるっていうのはちょっと違って、黄砂なのかもしれないね。

アレルギーもいろいろあるからね、めんどくさいね。私の場合にはゴールデンウィーク前くらいまでは花粉症みたいな感じになってるね。デグーを飼っている人の中にはその牧草のアレルギーが出ちゃって大変だみたいなのもあったなぁ

まあそんなわけで昨日内科を併設しているメンタル系の病院に行って花粉症の薬もゲットしました。

欲しいゲームの妄想

今、私は欲しいゲームが2つある。

一つは、コケテラリウム。もう一つは、無限に続けられるWizardry。コケテラリウムというのには聞きなじみがないかもしれない。小さな瓶や水槽なんかにコケを敷き詰めてオブジェクトを置き、それを眺めるものだ。

画像みたいなやつだね。見たことがあるかもしれない。私はこれをデスクトップ、もしくは放置ゲーム的に適当にできないかな。たまに水を見て霧吹きを吹いたり、新しいアイテムを置いたり、苔の掃除をしたり。そういうのが何かできたらなぁと思ってる。

もう一つは、ウィザードリー。それも昔々のやつみたいに、ただひたすらに潜ってぐるぐる動いては、ハック&スラッシュと。で、アイテムもあまりない方がいいかもしれない。やり込み要素があまりあると、集中力が続かない。体力が続かないんだよね。もうおじさんになって集中力を長く保つことができないのと、あまり気力が盛り上がらないのと、何よりやり込み要素を十分にやるだけの時間を確保できない。そうなるとね、本当はできるだけ楽しめばいいんだろうけれども、萎えてしまう。

逆に私が好きだったのは、ファミコン版のウィザードリー3とゲームボーイ版の外伝1だ。あれはもう本当にひたすらにひたすらにやった記憶がある。途中からはもうダンジョンの構造を手が覚えていて、攻略本も見ずにどんどんどんどん潜っていったように覚えている。まあ思い出補正もあるだろうし、今実際にやってみたら満足するかどうかはわからないんだけれども。

まあどちらにしても共通しているのはあまり考えずにのめり込めるかどうかということなんだろう。商用のゲームとしては、引き込む要素が薄くてあまり売りがないかもしれない。おそらく、だからそういうものは作られてないんだろう。あと、ボリュームが少ない。たまにゲームをどんなものがあるか検索するんだけれども1本のゲームで長時間ゲームができるというのが売りのようだ。やり込み要素 アイテムの合成 職業の合成 子孫などの要素。一般には売れる要素なのだろうが、残念ながら私にとってはNot for meだ。

自分で作ってみるしかないかもしれない。

今朝の知的活動

今朝は4時ぐらいに起きた。

起きてから1時間、1時間半ぐらいChatGTPといろんな話をした。せっかく早起きしたのだから、もっと有意義なことをするべきだったかもしれない。例えば、たまっている仕事を片付けるとか。でも、すごく知的には満足できる話だったので、まあよかろう。以下は長々と話したのをちょっとまとめてもらったもの、つまりChatGPTによるまとめだ。

ここ1か月ほど、国内外の動きを眺めていて、ふと「今回は重なり方がいつもと違うな」と感じることが増えた。日本の衆院選では、政党の再編や組織票の動き、メディアの報じ方と政治側の発信方法が絡み合い、従来の見方がしにくくなっているように思える。

一方で海外に目を向けると、米国内の混乱や中東・ロシア・中国を巡る不透明な動きが、短い間隔で続いている。これまでなら時間差で起きていた出来事が、同じ時期に並んで見えてくる感覚がある。

さらにAI分野でも、中国発の高性能モデルが次々に登場し、技術だけでなく経済や安全保障とも結びついてきた印象だ。どれか一つを断定的に語れる状況ではなく、今は「何が起きてもおかしくない」という前提で、静かに観測するフェーズなのかもしれない。今朝はそんなことをAIと整理していた。

ということでありました。