なるほど告知欄じゃねーの

■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 最新50 [PR]ぜろちゃんねるプラス[PR]  

ReplaceStr.txtを活用するスレ Part11

1 :Jane使いの名無しさん:2016/06/23(木) 11:29:37.78 ID:1ExLWnRG
■ReplaceStr.txtは、レス内の文字列を正規表現等で任意に置換できる機能です。
  定められた書式で記述することで「名前」「メール」「日付(末尾ID含む)」「レス内容」
  を自由に書き換えられます。

■前スレ
ReplaceStr.txtを活用するスレ Part10
http://jane2ch.net/test/read.cgi/community/1419356309/

403 :Jane使いの名無しさん:2018/05/07(月) 03:07:45.31 ID:MpN+KCJF
ReplaceStr.txtのスレなので何をどう置換したいかを書くか、自分のつくった定義そのものを書かないと質問の意図がよくわからないよ
文末なのになんで "(" と "「" がはいっているのか意味不明だし
<br>以外は文字クラスの[...]の中に列挙すればいいし?

レス本文の行末または文末の正規表現なら
[  ]*(<br>|$)
その直前の文字列★にマッチさせるなら
★+(?=[  ]*(<br>|$))

ちなみに運営が文末に罫線+1行(スレッドオプションとか)を追加したり、目玉+Rock54ハッシュ(警告)を追加したレスもあるので
それを除外した「レス本文の行末または文末」なら
[  ]*(<hr>.*|<small style=\"color: #999;\">&#128064;\s?<br>[^<]*</small>)?\s?(<br>|$) かな?

「<hr>〜」は場合によってフォントスタイルのタグがついた文字列や、!chkBBx:UA とかみたいに複数行のものもあるから、さらに適宜いじる必要があるかも

404 :Jane使いの名無しさん:2018/05/07(月) 13:49:59.17 ID:wtlzJsUC
自分の場合、大阪弁がほとほと嫌でそれ消すのが主目的なのです

〜やで!
〜なんか?(笑
〜まんなw

って感じのを置換してます

405 :Jane使いの名無しさん:2018/05/07(月) 23:32:49.14 ID:MpN+KCJF
NGExスレのを参考にしていじくったらどうかな?

http://jane2ch.net/test/read.cgi/community/1497272912/10+22

> 10 名前:Jane使いの名無しさん[sage] 投稿日:2017/07/08(土) 00:39:22.99 ID:BjVk23nJ
> いち乙
> 拾い物のNGExを組み合わせたら(理屈はよくわからないけど)わりといい感じになった
>
> 【エセ関西弁】(なんJ、猛虎弁、大阪弁)語尾
> ((あかん|ええ|ちゃう)[か|がな|で|な|ね|の|やん|よ|わ|ん]?|(やん|ねん)か?|[い|ん]がな|[い|ん]や[で|ね|ろ|わ]|やねん|だお)+[?、。]?([  ]*<br>)*[  ]*$
> (のう|のぅ|やで|やね|やろ|やん)+[ww?、。]?([  ]*<br>)*[  ]*$
>
> 【語尾の草ふたつ】
> [wwWW]{2}(?:[  ]*<br>)*[  ]*$
>
> 22 名前:Jane使いの名無しさん[sage] 投稿日:2017/07/11(火) 14:00:17.66 ID:NF3jpeOn
> >>10
> 「ちゃう」 → 「〜してしまう」の意味のときも消えてしまうので除外
> [か|がな|で|な|ね|の|やん|よ|わ|ん]? → [ ] ではなく ( ) でくくる
> [い|ん] [で|ね|ろ|わ] → | いらない

あえてReplaceStr.txtを使うのなら文意に応じてどう置き換えるかで定義を細分化する必要もあるので余計に面倒だとおもう
> 大阪弁がほとほと嫌でそれ消すのが主目的
ならNGExであぼんするほうが手っ取り早いだろうね
誤爆が多そうだけどまともなやり取りしてるレスだったら安価のポップアップから読めるはず

あと、オレは試してないけどReplaceStr.txtでだと
[ww?、。]?([  ]*<br>)*[  ]*$の部分は
[笑ww!?!?、。・・…〜ー()()」  ]*(?=[  ]*(<br>|$))
みたいにするといいかもね

406 :Jane使いの名無しさん:2018/05/08(火) 09:17:44.31 ID:7AnL7xrj
最近は「w」とか「笑」じゃなく「草」とか書く奴も居るから面倒だな

407 :Jane使いの名無しさん:2018/05/09(水) 01:10:58.51 ID:6/VEc+Uu
草生える

408 :Jane使いの名無しさん:2018/05/09(水) 03:23:47.67 ID:mgUCNkRW
>>406
行末の草は定義を分けたほうがいいのかな
<rx>([笑藁草ww]*|((糞|クソ|クソ|くそ)?ワロ[スタ]?|ワロ[タ]?|わろ[すた]?)|ゲラ|プッ?|プギャー*|(プ)?ゲラ|pgr|pgr)[!?!?、。・・…〜ー]*(?=[  ]*(<br>|$))【TAB】【TAB】msg
<rx2>[wWwW]{2,}(?![!#-'*-;=?-~])【TAB】w【TAB】msg以外のほとんどの嘲笑系はその都度NGwordに入れちゃってるんでテキトー

>>407
「草生」で既にNGwordに入ってる

409 :Jane使いの名無しさん:2018/05/09(水) 03:49:52.42 ID:7BocH9z9
素直に森だ

410 :Jane使いの名無しさん:2018/05/09(水) 10:53:37.12 ID:MTW8eoU7
草生って名字だというだけでNGされる人かわいそう
サダム・フセインって名前だというだけで会社をクビにされた人の話を思い出す

411 :Jane使いの名無しさん:2018/05/09(水) 11:00:21.62 ID:PvYdwVSn
【名字】草生
【読み】くさお,くさぶ

【全国順位】 32,560位
【全国人数】 およそ90人


412 :Jane使いの名無しさん:2018/05/09(水) 11:23:25.67 ID:Fa8wFciO
「こいつ馬鹿過ぎて草」
「草」
「草不可避」
「草がとまらねー」

こういう書き込み一定数居るしな

413 :Jane使いの名無しさん:2018/05/09(水) 13:15:12.84 ID:83rpKUHP
それはNGでいいけどな

414 :Jane使いの名無しさん:2018/05/09(水) 14:45:15.39 ID:/o4tDTH5
どっかのスレみたいにそんな事ばっか言ってるのはNGID
ロクなことすら話せないしな

415 :Jane使いの名無しさん:2018/05/09(水) 20:23:41.84 ID:mgUCNkRW
>>414氏の言に尽きる
個人名を話題にするようなスレには行かないからどうでもいいんだよね
オレは運営じゃないからNGしたからって巻きぞえで迷惑かけるわけでもなし

特定のワッチョイスレではアウとかhh\-とか携帯キャリアやプロバイダをまとめてNGExに入れて
読み返すようなスレでのまともなレスだったら安価のポップアップから個別に解除してるよ

ReplaceStr.txtをつかうまでのこともないとおもってるけど
「草生」さんを助けてあげたいんだったら>>410が定義をつくればいいんじゃないかな?

416 :Jane使いの名無しさん:2018/05/09(水) 21:02:54.60 ID:bohBHDlF
NGは使用者個人以外に全く影響ないから好きにすればええんやで
NG入れられて困るのは荒らし本人以外いないんやで

417 :Jane使いの名無しさん:2018/05/09(水) 21:22:50.29 ID:+iWe5Utu
これからは芝はえるにするは

418 :Jane使いの名無しさん:2018/05/10(木) 02:45:43.54 ID:sCx4MIMy
NGID、その板限定でサクっと入れられるといいのにな
NGExで板指定してちまちまとID入れてかなきゃいけない

419 :Jane使いの名無しさん:2018/05/10(木) 03:22:36.66 ID:WKGWTINe
これはくさだ

420 :Jane使いの名無しさん:2018/05/10(木) 06:47:02.47 ID:cg/r+/Tq
まぁ草に限らず嫌な書き込み内容は何処にでもいくらでもある事だし
全部を自動抹殺するのは無理がある

421 :Jane使いの名無しさん:2018/05/10(木) 08:14:40.14 ID:V035Eryl
>>353
> 大抵の顔文字

// [A∀Ддшωεσ∞▽□_ ̄^´``゚゜] のいずれかを含む、左右セットの半角/全角カッコ組み以降を顔文字・一行AAと見做し (AA略
<rx>[-ー―━ヲ-゚\ヽヾ┐⊂Σ  ]*[((|]+[^<))]*[A∀Ддшωεσ∞▽□_ ̄^´``゚゜][^<))]*?[))]+[^<]*(?=[  ]*(<br>|$))【TAB】<font color=darkgray>(AA略 </font>【TAB】msg

カッコが閉じてないものは拾えないし、カッコの前後の文字集合の扱いも適当(左側は半角カナ ヲ-゚ といくつかの記号だけ)
カッコ内が一般的なascii/shift-jis文字・記号だけの顔文字は含まれないので個別に対応しないとダメ
(>_<) → <rx>[((]&gt;_&lt;[))]【TAB】<font color=darkgray>(AA略 </font>【TAB】msg

NGExならもっと大ざっぱに「∀Ддшωεσ∞▽□_ ̄^´``゚゜」を問答不要であぼんするとか
カッコの片側 プラス [A∀Ддшωεσ∞▽□_ ̄^´``゚゜] として
[((|][^<))]*[A∀Ддшωεσ∞▽□_ ̄^´``゚゜]|[A∀Ддшωεσ∞▽□_ ̄^´``゚゜][^<))]*?[))]

422 :Jane使いの名無しさん:2018/05/10(木) 09:45:01.30 ID:PpUYbo66
このスレやImageViewURLReplace.datスレに相当誤爆するね

423 :Jane使いの名無しさん:2018/05/10(木) 14:38:31.12 ID:V035Eryl
>>422
文字クラスに ^ を含めてるから正規表現はほぼ壊滅でしょ?
顔文字によく使われそうな「文字化けしない記号」から適当に拾っただけなんで :P (│∧Ззpq ←こんなのとかもたまにあるかも)
でも m9(^Д^)プギャー (^ω^)ペロペロ だけじゃなく
\(^o^)/オワタ とか (^^; とかもあるからねぇ
(>_<) のほかにも m(_ _)m なんかの古い顔文字も個別に対処が必要なんだけど、半角アンダースコアまで括ってよいものかどうか…

どのみち>>391氏の<4>を<5>にして付け足さないと正規表現の出てくるスレはほとんど読めなくなっちゃうはず
板単位で除外するなら
<5>/(softwere|tech|community|8173)/
…とか、または巡回先のスレタイごとに
<5>ReplaceStr|NGEx\.txt|ImageViewURLReplace
…みたいな感じで
後者なら正規表現、プログラム、各スクリプトやプログラム言語、DB、エディタのスレとかも足さないとね
あとは数学、理工系や外国語関係のスレもやばそうかな

424 :Jane使いの名無しさん:2018/05/10(木) 19:32:35.49 ID:VpMaW+eu
そういうのより恫喝・恐嚇めいた言い回しや挑発的な言い回しを多用する奴がちょっとな
猛虎弁とか可愛いレベル

425 :Jane使いの名無しさん:2018/05/10(木) 23:49:32.08 ID:nC49tzEO
〜だろ→〜なんだもーん で対応

426 :Jane使いの名無しさん:2018/05/11(金) 00:03:58.25 ID:Q7NupeKy
「だろ」で終わるか「だろ?」みたいなのに限定しないと、そうなんだろうな が そうなんなんだもーんうな になるなw

427 :Jane使いの名無しさん:2018/05/11(金) 00:11:41.41 ID:OQIM7BJM
カワイイは正義なのでおk

428 :Jane使いの名無しさん:2018/05/11(金) 00:35:01.88 ID:m2Psgv3P
恫喝・恐嚇・挑発はNGでしょ
「ぶっ殺すぞクソボケが!」 → 「††しちゃいますよダーリン♪」なんて置換してまで読む必要ない

>>422-423 自己レス
> このスレやImageViewURLReplace.datスレに相当誤爆するね
> 正規表現の出てくるスレ

そういえばstyleのサンプル「URL内の"("")"をエンコードしてURL化する」定義からも除外しないといけなかったっけ
%28 %29 じゃなく &#40; &#41; に置換する定義もあったね

429 :Jane使いの名無しさん:2018/05/11(金) 10:29:03.07 ID:iyHCaJfq
「死ね」とかは「僕はキチガイです」に置換してる

430 :Jane使いの名無しさん:2018/05/11(金) 11:33:57.25 ID:qlBpPkmg
自分だけが見てる他人に影響のないブラウザの設定の話なんだから

俺はこれNGにする、それNGにするの?置き換えてまで読む必要ない!

とかは、どうでもいい話だよね、好きにすりゃいい話で他人がどうこう言う必要はない

431 :Jane使いの名無しさん:2018/05/11(金) 12:18:40.59 ID:hpCiffz8
ま、そうだけど そういうことの具体方法を知るスレだろ
あまりくだらんのは鯖資源の無駄だが人によっては有用
スクロールバードラッグする手首資源の無駄回避に行空け削除定義入れるか

432 :Jane使いの名無しさん:2018/05/11(金) 13:10:12.44 ID:JVd1Hr2g
好きにすりゃいいけどどんだけスルー能力低くて煽り耐性無くてメンタル弱いんだか
リアルで言われたら拳プルプルさせながら顔真っ赤にしてそう

433 :Jane使いの名無しさん:2018/05/12(土) 11:12:06.19 ID:1GTQVuJp
>>430
そう思うなら焦らさないで教えてあげようよ

434 :Jane使いの名無しさん:2018/05/13(日) 02:38:26.50 ID:LU3EM5ks
質問や練習でも他人の着眼点っておもしろいし参考になる
対象URL/タイトルの<4>とか<5>はこのスレ見て使うようになって誤爆もだいぶ減らせたし
特定の板やスレをピンポイントで絞れて助かってる

>>421の最後の行
[((|][^<))]*[A∀Ддшωεσ∞▽□_ ̄^´``゚゜]|[A∀Ддшωεσ∞▽□_ ̄^´``゚゜][^<))]*?[))]

の (AB*C|CB*D) みたいな置換元ってシンプルにまとめることはできるのかな?
置換先でなら$1や$2になるけど、置換元でCやBの部分が長いと読みづらくなるからまとめたい
それともまとめないで別々の定義として分けておくほうが処理速度があがるとかあるの?

435 :Jane使いの名無しさん:2018/05/13(日) 03:03:48.20 ID:ALPHZ/QK
部分式呼出しを使えばまとめられる
[((|]\g<2>*\g<1>|([A∀Ддшωεσ∞▽□_ ̄^´``゚゜])([^<))])*?[))]

数字じゃなく名前を付けて呼び出しも可
[((|]\g<end>*\g<symbol>|(?<symbol>[A∀Ддшωεσ∞▽□_ ̄^´``゚゜])(?<end>[^<))])*?[))]

436 :Jane使いの名無しさん:2018/05/13(日) 03:05:24.13 ID:LU3EM5ks
>>421の最後の行
[((|][^<))]*[A∀Ддшωεσ∞▽□_ ̄^´``゚゜]|[A∀Ддшωεσ∞▽□_ ̄^´``゚゜][^<))]*?[))]

のばあいだと、出現頻度が高い ( ) ( )と出現頻度が低い [A∀Ддшωεσ∞▽□_ ̄^´``゚゜] とあるけど
[((|][^<))]*[A∀Ддшωεσ∞▽□_ ̄^´``゚゜] と [A∀Ддшωεσ∞▽□_ ̄^´``゚゜][^<))]*?[))] のどちらを先に配置するほうがマシとかもあるのかな?

437 :Jane使いの名無しさん:2018/05/13(日) 03:13:46.60 ID:ALPHZ/QK
理論上は出現頻度が高いものを先に配置した方が速くなるが、計測可能な差が出るかは微妙
それよりも桁違いに頻度が高いはずの「いずれにもマッチしない」場合に素早くマッチ失敗させることが大事

438 :Jane使いの名無しさん:2018/05/17(木) 18:50:38.09 ID:6q4Yv0jO
もらい物だけど『URL内の括弧 "(" と ")" を ( ) にしてURL化する』3行セットの定義
けっこう誤爆?するのね
%28 %29 のほうがうまい場合と ( ) のほうがいい場合とあるらしくてもにょる

439 :Jane使いの名無しさん:2018/05/17(木) 18:53:45.63 ID:6q4Yv0jO
amp;を入れ忘れた
>>438

もらい物だけど『URL内の括弧 "(" と ")" を &#40; &#41; にしてURL化する』3行セットの定義
けっこう誤爆?するのね
%28 %29 のほうがうまい場合と &#40; &#41; のほうがいい場合とあるらしくてもにょる

440 :Jane使いの名無しさん:2018/05/22(火) 07:52:54.93 ID:dmhUKGYn
草→候 で試用中

441 :Jane使いの名無しさん:2018/05/22(火) 09:06:46.83 ID:dT7yArRY
草www
それは良い案だなwマジで草生えるザンスでごわす超草不可避(笑

442 :Jane使いの名無しさん:2018/05/23(水) 03:13:52.97 ID:j8pESK9B
パーフェクト

443 :Jane使いの名無しさん:2018/05/23(水) 14:22:40.07 ID:pmbYzCQZ
Janeの正規表現ってどこで勉強すればいいですか
Janeのは微妙に違うし、正規表現の本はめっちゃたかい

444 :Jane使いの名無しさん:2018/05/23(水) 14:26:16.53 ID:ocYpnGX/
普通の正規表現覚えたら問題ない

445 :Jane使いの名無しさん:2018/05/23(水) 14:53:46.94 ID:vSakEzrd
>>443
http://k-takata.o.oo7.jp/mysoft/bregonig.html
ただし、Jane Styleに同梱されているものはv1.46なので、
v2、v3以降とかコメントされているものは、自分でdllを入れ替えて使う分には構わないが
公開すると、動かないと言われる恐れがある

446 :Jane使いの名無しさん:2018/05/23(水) 19:50:49.10 ID:15cpdTF/
>>443
俺は正規表現の初心者用っぽい解説サイトあちこち読みつつ
ReplaceStr Toolで他人の記述や自作記述を試して体で覚えたよ
本買う必要は無いんじゃないかな

447 :Jane使いの名無しさん:2018/05/23(水) 20:56:03.00 ID:19h1GKgC
自分は頭で覚えた

448 :Jane使いの名無しさん:2018/05/23(水) 20:59:39.80 ID:NsTAAi2Z
正規表現はまず本筋を覚えたほうがいいよ
いきなり方言から覚えると後がめんどい

449 :Jane使いの名無しさん:2018/05/24(木) 01:26:00.66 ID:wzDMcf9a
大昔にsedと256倍本で挫折したおっさんは何でやり直すといいでしょうか?

450 :Jane使いの名無しさん:2018/05/24(木) 02:16:24.49 ID:0Y1oi5G0
edからやり直せ

451 :Jane使いの名無しさん:2018/05/29(火) 21:10:26.80 ID:9Myg0ChY
>>388
>Meryの編集モードにReplaceStr.txtの正規表現の強調用の定義を入れた
のMSYファイル
https://pastebin.com/raw/AuDE1meT

https://egg.5ch.net/test/read.cgi/software/1470539869/56

452 :Jane使いの名無しさん:2018/05/31(木) 00:55:34.25 ID:HrlFr2bN
>>435
たいへん遅くなってしまったけれど、ありがとう!

顔文字AA用定義を(おもにNGExで)まとめたのでNGwordからは削ったはずなのに
漏れがあって435が透明あぼーんになってしまっていたことに今気が付いた…
名前付き捕獲式集合 (?<name>pattern) や部分式呼出し \g<name> \g<n> の使い方もこれで理解できるようになれそう
NGExだと435の書き方でシンプルにできたけど
ReplaceStrでやるとなると前後に範囲を広げて拾えるように条件を足してさらにやりくりしないと左側におコボレが残るね

あとは照合開始位置 \G の使い方をおぼえたいところ
Part10でもいくつか出てたとおもうけど理解できてない

139KB
新着レスの表示

名前: E-mail(省略可)
READ.CGI - 0ch+ BBS 0.7.2 20130511
ぜろちゃんねるプラス