技術・コンピュータ・プログラム – ページ 4

Rinna4BをCtranslate2で軽くしてWindowsで動かした。

から sougetuOte | 2023/08/15 - 09:57 |2023/08/15 技術・コンピュータ・プログラム

一昨日、昨日と頑張ってた「Japanese StableLM Alpha」なのだけど、とりあえず他のから動かしてみて、実績を作る事にした。そのうち、分からなかったところも治せるようになるだろう。

そんなわけで今朝は「rinna/bilingual-gpt-neox-4b-instruction-ppo」をCtranslate2で量子化して動かす事にチャレンジ。

主にこちらを参照に。他にも色々見てたのだけど訳が分からなくなってしまった。

前提条件

windows11
Python3.10.10
仮想環境はpyenv + venvで作成

# 環境作成
pyenv local 3.10.10
python -m venv .venv
.venv/Scripts/activate
python -V
pip install --upgrade pip
python -m pip install --upgrade pip

#torchのインストール
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

# ctranslate2インストール
pip install ctranslate2
pip install sentencepiece transformers
pip install protobuf

# 変換
ct2-transformers-converter --model rinna/japanese-gpt-neox-3.6b-instruction-ppo --quantization bfloat16 --force --output_dir rinna-ppo-bf16

変換は、bfloat16にしてみた。この状態で動かしても６Ｇ程度。変換で使用したメインメモリは２０G程度だったかな？（うろ覚え）応答も十分早く、遅延は気にならなかった。

最終的に動かしたコードは以下の通り。

import ctranslate2
import transformers
import torch
import os

os.environ["CUDA_VISIBLE_DEVICES"] = "0" #GPUを使用する場合はコメントアウトを外す
model='rinna-ppo-int8' #directory of the model

ppo = "rinna/japanese-gpt-neox-3.6b-instruction-ppo"
generator = ctranslate2.Generator(model, device="auto")
tokenizer = transformers.AutoTokenizer.from_pretrained(ppo, use_fast=False)


# プロンプトを作成する
def prompt(msg):
    p = [
        {"speaker": "ユーザー", "text": msg},
    ]
    p = [f"{uttr['speaker']}: {uttr['text']}" for uttr in p]
    p = "<NL>".join(p)
    p = p + "<NL>" + "システム: "
    # print(p)
    return p

# 返信を作成する
def reply(msg):
    p = prompt(msg)
    tokens = tokenizer.convert_ids_to_tokens(
        tokenizer.encode(
            p,
            add_special_tokens=False,
        )
    )

    results = generator.generate_batch(
        [tokens],
        max_length=256,
        sampling_topk=10,
        sampling_temperature=0.9,
        include_prompt_in_result=False,
    )

    text = tokenizer.decode(results[0].sequences_ids[0])
    print("システム(ppo-ct2): " + text + "\n")
    return text


if __name__ == "__main__":
    # import readline
    while True:
        msg = input("ユーザー: ")
        reply(msg)

次にint8でも実行してみた。VRAMは4Gほどか？応答速度は、これも気にならなかった。応答精度も高い。

Japanese StableLM Alpha 7B チャレンジ中

から sougetuOte | 2023/08/14 - 22:37 |2023/08/14 技術・コンピュータ・プログラム

コメントを残す

先日公開された「apanese StableLM Alpha 7B」をローカルで動かせないかチャレンジ中。

自分の環境はWindows11+VRAM12Gbなので8bit化しないと動かない。公開されている記事の多くはGoogleColabでそのままでは自分の環境では使えない。Windows11での記事も一箇所見つけたのだけど、公開されているサンプルをそのまま動かしていたので、VRAMも潤沢なのだろう。私が詰まっているポイントでは参考できない。

そもそも私はAIの事を勉強したことはない。昨年のAIブームを受けて騒いでいるミーハーだ。でもまぁこれを機会に自分なりの物を作ってみたいと思っている。langflowとやらを使えば何とかなるんじゃ無いかと思っているんだが。

Windows11ローカルが駄目ならWSL2。そっちの方が楽という呟きもちょいちょい見ているので、駄目ならそっちに行こうと思って居る。

もしくはRinna4Bも作例が多いように思って居るのでそっちから手を付け直しても良いのかも。いや、むしろそっちの方が良くないかなぁ。

ちょっと調べて、考えてみる。

langChain勉強開始

から sougetuOte | 2023/07/05 - 22:06 |2023/07/05 技術・コンピュータ・プログラム

コメントを残す

ChatGPTをAPIを通じて操作するとき、自力で実装するのが難しい・手間が掛かる時に使うライブラリがlangChain。（という理解）

占いアプリ、Misskeyでのボットなんかをやってみたいので勉強することにした。

新しいことをやっておかないとどうしても鈍ってしまうし、一応プログラムを教える講師としては新しい物を追っていないのは恥ずかしい。

コアを作ってしまえば、ガワはある程度どうにかなるはず、と目論んでる。どうなりますかな。

faster-whisperを使って口述筆記に挑戦

から sougetuOte | 2023/05/31 - 07:52 |2023/05/31 技術・コンピュータ・プログラム

コメントを残す

OpenAI社のAIの話を追っかけでして、Whisperの存在を知り、口述筆記をやってみたいと思って居た。

そしたら先日、Whisperより早く、GPUも食わないfaster-whisperというモジュールの存在を知った。

一昨日、以下のサイトからサンプルプログラムを頂き、動かしてみた。結果は良好。

「[ローカル環境] faster-whisperを利用してリアルタイム文字起こしに挑戦」

しかし残念な事にこのプログラムは話したものをテキストに落とす部分が無い。あと、終了させるときにエラーが出ちゃう。そこをちょいとだけ改造してみた。昨夜何度か試したが、問題は無い模様。次はGUIにしたり、ChatGPTと連携させたりとかかな？

黒歴史、作ります。後ChatGPTすごい。

から sougetuOte | 2023/05/04 - 21:08 |2023/05/04 技術・コンピュータ・プログラム

コメントを残す

今年のGWはプログラム作成強化週間となりました。

先月末から別アカウントの方で使うソフトを作成し、今日リリース。小っさいプログラムなので今後アップデートは余り無い予定。GUIがダサいので多少作り直すかもしれないけど。

で、GWの残り何をするか。

今回プログラムをChatGPT4と作って思ったんだけども。ChatGPT4との協力は良いね。何が良いかって言うと、作業に対する心理的な敷居がだいぶ低くなる。

引っかかったらとりあえず聞く。何らかの答えが出る。自分で調べるなりもう一回聞くなりして精度を高める。一人で作ってると煮詰まりがち。そして段々面倒くさくなって止まる。やりたい事が見つかっても、とっかかりが見つからなくて止まってしまう。そういう事がかなり減る。これは私のようなやる気無し勢からするとデカい。

まぁただ、普段のスピードと違ってウェイトがあまり掛からないので、疲れちゃうのが玉に瑕、か？

で、そこで思ったんですわ。そーいえば、敷居が高くなって止まったモノがあったなと。

小説です。以前、書いてた小説、カクヨムに載せてたんだけど１話書くのに５時間は掛かってた。それでも中断したり何たりしながらも一年半くらいは頑張ったのかな。でもそこで止まってしまった。やっぱり１話に時間が掛かりすぎる。書くことに対して気が重くなってしまった。

そこでChatGPTですよ。アイディア出しとか執筆そのものなんかをフォローしてくれると嬉しい。全自動というのはよく見かけるけど、協力態勢はあまり見かけない。そして短編では無くて長編の手伝いをしてほしい。

ChatGPTの記憶に関してはトークン毎の料金の問題もあり、あまり使える手段では無い。なので、全編を通してのアドバイスとかはちょっと難しい。スポットで表現を見て貰うとかそんな感じになるのかな？

となれば、一番にやって貰いたいのは口述筆記。大まかにやってくれれば良い。後は手動で直したりChatGPTに投げたり出来ればそれで。下ごしらえをしてくれるだけで大幅に時短になるし、モチベーション維持にも役立つはず。

幸い、OpenAIのソフトにはWhisperというものがある。ネットで見かけるのはこれのAPIを使ってのSpeech to Text(or chat）な訳なのだが、せっかくRTX3080(12Gver)を持っているのでローカルで動かしたい。これを使って喋った内容を一端テキストに変換する。これを第１段階とする。

変換が出来るようになったら、それを適当なテキストボックスか何かに入れて雑に編集。質問点なんかを添えてChatGPTに質問。戻ってきたモノを見ながら修正。さらに再質問、みたいなサイクルが出来ると良いなと。

まぁ雑に考えているだけなので、やっていくうちに変わる部分も多々有ると思うのだけど、とりあえずはこんな感じ。

遊ぶつもりがなかなか上手く行かず

から sougetuOte | 2023/01/15 - 19:38 |2023/01/15 技術・コンピュータ・プログラム, 日記

コメントを残す

今日はとりあえず暇になる予定だったので、PythonのFlaskのお勉強で遊ぼうと思ったんだがなかなか上手く行かず。

なんか色々と細かな用事的なものが発生したり、開発環境の不備を修正したり。

気がつけば一日空いてたはずなのに午後７時で３時間くらいしか遊べてない。５時に起きたのに。ぐぬぬ。

POINT-Eのその後

から sougetuOte | 2023/01/11 - 07:01 |2023/01/11 3D, 技術・コンピュータ・プログラム

コメントを残す

書くのを忘れてたので、防備録。GUIを見ずに描いてるので数字は適当。

年末年始でPOINT-Eをイジってみた。GUI部分をイジってGRID部を１５０くらいからMAX2500くらいに書き換える。さすがに2500だと遅すぎたので、1200くらいにして実行。まぁそれでもすごく遅かったが。でも500じゃクォリティ足りないのよね。

結局、うちのRTX3080では1200くらいでも実用には遠かった。恐らく、今回のこれは「こういう技術出来たんでよろしく」的なものだったんだろう。家庭用３Ｄプリンターで出力するにも足りない生成物しか出来なかった。

半年とか１年後とかにそこそこ遊べる物が出てくるんだろうなぁ。

テキストから３Ｄオブジェクトを生成するＡＩ「POINT-E」インストールしてみたが

から sougetuOte | 2022/12/30 - 17:28 |2022/12/30 技術・コンピュータ・プログラム

コメントを残す

先日、OpenAIからリリースされたPOINT-E。様々な技術系ニュースサイトでも紹介された。
文字から3Dモデルを生成するAI「Point-E」

折角良いグラボがあるのだからとインストールを試みる。GUIで出来ないかと探したところ、こちらの「【テキストから3Dモデル生成】Point-E GUIツールのインストール (ジコログ)」記事を参考に頑張ってみた。

頑張ってみたものの、できあがりのクォリティは良くない。幾らか設定を触ってみるが駄目。Colaboratoryで動かすやり方も有るので、それをローカルで動くようにしてみようと思う。

サーバ建ててる

から sougetuOte | 2022/12/20 - 09:35 |2022/12/20 技術・コンピュータ・プログラム, 日記

コメントを残す

先週金曜から思い立ってサーバ建て始めた。VPS取って独自ドメインついてるサーバが二つほど余ってた（？）のでそれを活用することにした。ドメイン取ってるのにOSもインストしてないというタワケ振り。直ぐ建てるつもりだったのだけど、何かと後回しにしているうちに……。

OSはRockylinux9。継続的に使っていくつもりなのでメールサーバも作る。PythonのFlaskというフレームワーク使って何かする予定。

手順を逐一書き出して、来年度の教材にしたい。結構進んできていて、現在330行くらい。Wordに持っていって画像入れるかどうか分からんけど、書式揃えたりしたらえらいページ数になりそう。

グラボとメモリがグレードアップした

から sougetuOte | 2022/11/30 - 22:07 |2022/11/30 技術・コンピュータ・プログラム, 日記

コメントを残す

グラボの買い換えは11月9日。現在11月30日なのでちょっと前になる。

stable-diffusionつーかWifu-Diffusionで色々お絵かきしてたのだが、贅沢なことに3060ti-8Gで性能不足を感じてきた。特にメモリ。で、買い換えた。

買ったのは「MSI GeForce RTX 3080 VENTUS 3X PLUS 12G OC LHR」お大尽である。購入時価格はおおよそ15万。アプライドで現物確認して買った。

おかげでお絵かき楽々！と言いたい所なんだが、仕事が溜まりすぎてほぼ使ってない。そのため性能が意識できなくて残念である。余裕が生まれるのはもう少し先っぽいので頑張る。

さて、お次はメモリである。ブラックフライデーに併せてAmazonで買った。

購入したのは「v-color Hynix IC デスクトップPC用ゲーミングメモリ Skywalker Plus Golden Armis DDR4 4266MHz PC4-34100 64GB」名前がクソ長い。これまでは「CORSAIR DDR4 2*16GB 2666MHz」だったので、容量もクロックもだいぶパワーアップした。

これが届いたのが本日。11月30日である。

現在の構成は以下の通り。我が事ながらすさまじい。

部品名	製品名	購入日
CPU	AMD Ryzen 5 5600X	2021/6/23
CPUファン	虎徹Ⅱ	2021/6/23
マザーボード	ASUS TUF GAMING B550-PLUS	2021/6/23
メモリ	v-color Hynix IC DDR4 4266MHz 64GB	2022/11/30
グラボ	MSI GeForce RTX 3080 VENTUS 3X PLUS 12G OC LHR	2022/11/9
SSD	intel ssdpeknw020t9(Intel SSD 665p 2T)	2020/10/4
SSD	CT1000MX500SSD1/JP	2018/1/23
HDD	ST4000DM004-2CV104	2017/11/11
HDD	ST4000DM004-2CV104	2017/11/11
電源	玄人志向 KRPW-BK750W/85+	2021/6/23
ガワ	Antec P10 FLUX	2021/6/23
DVD-RAM	LITEON?	不明
ディスプレイ	Acer VG240YUbmiipfx	2022/4/17
液タブ	XP-Pen Artist 24	2022/3/11

検索対象:
カテゴリー
- インフォメーション (17)
- 小説 (3)
- 技術・コンピュータ・プログラム (195)
  - 3D (9)
  - AI (2)
  - CentOS (19)
  - clonezilla (4)
  - Java (1)
    - JavaFX (1)
  - Rails (4)
  - SublimeText2/3 (8)
  - vim (4)
  - VR (7)
  - 教育 (1)
- 日記 (742)
  - EVE online (1)
  - ingress (1)
  - skyrim (1)
  - アクアリウム・テラリウム (66)
  - セカンドライフ (1)
  - デグー (245)
  - ボーンカービング (23)
  - 体重 (132)
  - 太極拳 (5)
  - 料理 (14)
  - 絵 (5)
- 詩 (5)
- 雑記 (10)
- 魔術 (1)
2026年8月

月火水木金土日

1 2

3 4 5 6 7 8 9

10 11 12 13 14 15 16

17 18 19 20 21 22 23

24 25 26 27 28 29 30

31

« 7月
カテゴリー
カテゴリー
検索対象:
2026年8月

月火水木金土日

1 2

3 4 5 6 7 8 9

10 11 12 13 14 15 16

17 18 19 20 21 22 23

24 25 26 27 28 29 30

31

« 7月

2026年8月
月	火	水	木	金	土	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

2026年8月
月	火	水	木	金	土	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

前提条件

カテゴリー

カテゴリー