2007-11-01から1ヶ月間の記事一覧

中の人という立場って難しい

http://www.ylug.jp/modules/pukiwiki/index.php?YLUG 「第82回カーネル読書会」で話が出るかもしれない アレは私も設計を担当していた (微妙ではあるが、嘘ではない) ので、参加したい気もあるが、どうしようかな。中の人の立ち位置が難しい。 アレとか伏字…

なんという無駄の無駄遣い

当然、違うところに萌えているわけですが、Linux のみなさん、jfbterm + vlc 256 color くらいで誰か作ってくれないかなぁ。 といいつつ、ちょっと作ってみたい。Excel に負けるわけにはいかない。(w

並べ替え

filtering for identical field labels ***record*** TAG1 A TAG2 B irrelevant------------------ TAG2 C TAG3 D TAG4 E # ***record*** TAG1 f TAG2 g TAG2 h irrelevant------------------ TAG3 i TAG4 j #というファイルがあり、これを以下のようにした…

ファイルのパース

File parsing 10 abc 20 abcc 30 abcd 40 xycz 42 wxy 5 abc 20 abcd 30 abccというファイルがあり、最初のステップで以下のようにします。 "abc" - 10 "abcc" - 20 "abcd" - 30 ...次のステップで "abc" 10 - 5 = "abc" 5 "abcc" 20 - 30 = "abcc" -10のよ…

数学問題

awk math results differ from other languages 計算結果が awk だけ異なると言うものです。 $ echo "111111111 * 111111111" | bc -l 12345678987654321 $ perl -le 'print 111111111 * 111111111' 12345678987654321 $ python -c "print 111111111 * 11111…

フォーマットの問題

formatting question... 2007-10 14,807 1,604 29,600 2007-09 15,173 521 35,853 2007-08 12,799 1,236 516 2007-07 5,780 416 37,135というファイルがあり、以下のように出力したいそうです。 2007-10 14,807 1,604 29,600 2007-09 15,173 521 35,853 2007…

csv のヘッダーをどう扱うか

Refer to field headings? awk に csv のフィールドの位置ではなく、ヘッダーで一致させることができるかというものです。 awk '( $4 ~ /ASPAC/) {do something;}' < input_file ではなく awk '( region_name ~ /ASPAC/) {do something;}' < input_file のよ…

変数のセットに awk を用いる

awk question set myvariable = `awk '{print $1}' cool`としても動作しないのは何故かというものですが・・・結果が読めないぞ・・・shell が bash 系というオチでいいのかな? myvariable=`awk '{print $1}' cool`で動作したようですが、質問者が「空気読め…

tac の代用

tac replacement 最後から先頭へ向かって処理したいので、tac の代用はないかということですが、sed で以下のようなものを使っているそうです。 sed -e '1!G;h;$!d'以下の Juergen Kahrs の回答はどうかと思いますけど・・・。 awk '{print NR, $0}' data_fi…

awk できちんとマッチしない

*really* shortest match in awk - possible? awk '/^----/,/^____/{next}{print}' というものが正常に動作していないというものです。具体的には、以下のようなファイルを使っています。 From - Sun Sep 18 12:55:25 2005 (...) Some text I want to keep S…

テキストにある文字列ブロックを挿入する

inserting beg/end lines by blocks of text 1 test1 1 test2 1 test3 2 test1 2 test2 2 test3 2 test4 3 test1 3 test2 3 test3というファイルを以下のようにしたいというものです。 1 beg 1 test1 1 test2 1 test3 1 end 2 beg 2 test1 2 test2 2 test3 2…

範囲内の使っていない数字を求める

optimization - search free value through a range MIN_VALUE=800 MAX_VALUE=810という数字の範囲で、以下のファイルから使っていない数字を求めるというものです。 #> cat all_values 100 200 800 801 803 900以下のようなコードを書いたので、最適化して…

マッチした特定の場所を抜き出す

How to gram awk's regexp submatches? 以下のような場合にマッチした数値だけを抜き出したいと言うものです。 $echo "test4325363test" | awk "/(.*)([0-9]+)(.*)/ {print NUMBER HERE!}"代表的なものに match() を使うのと gensub() を使うものがあります…

異様な盛り上がりの Netnews

awk

なぜか comp.lang.awk が盛り上がっているわけですが、先週帰省のため追従してない部分を含めて紹介したいと思います。

Subversion の履歴の移行

レポジトリ分割の作業記録 - daily dayflower とりあえず新規レポジトリを作るまでもないけど作業履歴をとっておきたい, という場合,わたしは Sandbox というレポジトリに全部つっこんでいます。とりあえず Subversion には突っ込んでおきたいけど、それを…

オープンソースの活動って何があるだろう?

米Google:中高校生向けのオープンソース活動コンテスト | OSDN Magazine 課題の分野は、コード記述、文書作成、研究、品質保証、翻訳、ユーザーインター フェースなど。なんか非常に普通。いや、この普通ができないので、コミュニティというのが難しいわけ…

小飼さんのコメント

フィボナッチって食える? - 日本 GNU AWK ユーザー会 0.2 トラバによる補足され率はやっぱり高いなぁ。 このページの役目は「なんか awk でもやってるな」と他言語をやっている人にも知られることでもあるので、個人的には満足。

お前はオレか!?

http://www.kt.rim.or.jp/%7ekbk/zakkicho/07/zakkicho0711c.html#D20071128-1 つい最近ナイトウィザードで 奥井雅美節は今だに健在 と認識した自分だったが 三重野瞳節は今でも最高だな と痛感うんうん、わかるよ。(w どちらもコンサートに行きまくっていた…

URL の特殊文字エスケープ

http://ja.doukaku.org/92/nested/ 文字列操作が得意なはずの awk は、急に弱くなります。というか、多分できません。LL じゃなく、それだけを行なってくれるさるぅんなコマンド ってないのでしょうか?

エラストテネスと間違っていた時代もありました

awk

404 Blog Not Found:プログラマーでなくても名前ぐらい覚えておきたいアルゴリズムx10 では 2 つめのエラトステネスの篩です。エラトステネスの篩 - Wikipedia を見て作ったのが、こちらです。 #! /usr/bin/gawk -f # eratosthenes2.awk - get prime numbers…

フィボナッチって食える?

awk

404 Blog Not Found:アルゴリズム百選 - フィボナッチ数列にO()を学ぶ これも何度目かの紹介ですが、awk でもメモライズできます。まず、再帰を使ってフィボナッチ数列を計算してみます。 #! /usr/bin/gawk -f # fibonacci2.awk - calculate fibonacci numbe…

私は誰?

awk

あーありがち - 自分自身が起動されたかどうかを確認 以前にも書いたネタですが、Linux のように /proc があれば以下のようにして取得できます。 #! /usr/bin/gawk -f # who_am_i.awk - print my name :-P # usage: gawk -f who_am_i.awk # input: none # ou…

ネットワーク越しの screen

あーありがち - ネットワーク越しに nkf を使うときは rlwrap もあると便利 うちは、TeraTermPro から EUC-JP 環境の Zaurus に接続して、Zaurus 上の screen から UTF-8 環境の Fedora に ssh してますが、文字化けしませんね。つまり、「localhost の scre…

単語頻度カウント

経典をはじめ、多くの書籍では以下のような感じですかね。 { for (i = 1; i <= NF; i++) { count[$i]++; } } END { for (i in count) { print i ": " count[i]; } } 真面目にやるにはもう少し手を加えないとね。

単語ごとに区切る

単語ごとに区切るプログラム - みずぴー日記 ちょっと gawk の機能を使ってみたかったので作ってみました。いわゆる文字クラスを用いているところと、まとめたい部分に故意に括弧をつけているあたりがポイントですかね。 いわゆる文であれば、コメントを冒頭…

ユークリッドの互除法

404 Blog Not Found:プログラマーでなくても名前ぐらい覚えておきたいアルゴリズムx10 ユークリッドの互除法 - Wikipedia にも書かれているようなアルゴリズムであり、密かに (知らず知らずのうちに) 多用されるアルゴリズムでもあります。多分、Wikipedia …

日付の引き算

日付の引き算 - みずぴー日記 gawk では mktime() 関数が追加されていますので、簡単に計算することもできます。実際には、エポックタイムからの経過秒数に直してから引き算を行います。 #! /usr/bin/gawk -f # usage: gawk -f dday.awk YYYY/MM/DD # input:…

アルゴリズムと LL (てか awk)

404 Blog Not Found:プログラマーでなくても名前ぐらい覚えておきたいアルゴリズムx10 もうこの本しかないと言っていいくらいだったりするのですが、「プログラミング言語 AWK」です。以下のアルゴリズムは awk でサンプルコードが載っています。 クイックソ…

黄金率と美しさ

http://www.markupdancing.net/archives/182 最近、黄金率は不安定な象徴ではないかと思っていたりするのですが、そういう文献を発見できていないので、思っているだけです。つまり黄金率は左右対称とか支えあってはじめて、安定するのではないかとか想像し…

Zaurus の後継機種?

ノキア N810 インターネットタブレット 発売 - Engadget 日本版 Linux ベースだと言うことですが、CUI (run level 3) とかでも十分使えるのだろうか? そういう使い方をしている私が普通じゃないのだろうか?