Perl で、1GB のデータ（テキストファイル）を作成する方法

次のコードを makefile.pl などというファイル名で保存して、chmod +x ./makefile.pl し、そして ./makefile.pl を実行すれば makefile.pl と同じディレクトリ上に sample.txt に1GiB （ギビバイト＝2^30）ぴったりのデータ（「a」の文字で埋め尽くされたテキストファイル）が作成されていると思う。プログラム的には、例えば 1KiB のダミーデータを変数（$data）に入れてそれを 1024 x 1024 回書き込んだ方が 1文字ずつ 2^30 回書き込むよりも速いと思うが、試してみたらバァッファオーバーフローしてるのか？うまくいかなかった。
ちなみに、2^30 = 1ギガバイト = 1,073,741,824 バイト = 1024 バイト x 1024 キロバイト x 1024 メガバイト

#!/usr/bin/perl

open(OUT, '>sample.txt');
for(my $i = 0; $i < 2^30; $i++) { print OUT 'a'; }
close(OUT);

1;

次のコードを makefile.pl などというファイル名で保存して、chmod +x ./makefile.pl し、そして ./makefile.pl を実行すれば makefile.pl と同じディレクトリ上に sample.txt に1GiB （ギビバイト＝2^30）ぴったりのデータ（「a」の文字で埋め尽くされたテキストファイル）が作成されていると思う。プログラム的には、例えば 1KiB のダミーデータを変数（$data）に入れてそれを 1024 x 1024 回書き込んだ方が 1文字ずつ 2^30 回書き込むよりも速いと思うが、試してみたらバァッファオーバーフローしてるのか？うまくいかなかった。
ちなみに、2^30 = 1ギガバイト = 1,073,741,824 バイト = 1024 バイト x 1024 キロバイト x 1024 メガバイト

#!/usr/bin/perl

open(OUT, '>sample.txt');
for(my $i = 0; $i < 2^30; $i++) { print OUT 'a'; }
close(OUT);

1;

Posted on 2008-04-26 by yas |

PHP で、ディレクトリの中のファイル名を取得する方法

こんな感じ。 !ereg('(^\.$)|(^\.\.$)', $file) とある行は、カレントディレクトリ（.）と、親ディレクトリを除いて処理するためのもの。 $filename[] の配列中に、ファイル一覧が入る。

<?php

$dir_path = 'your_directory';
$filename = array();

$dir = dir($dir_path);
while($file = $dir->read()) {
  if(!ereg('(^\.$)|(^\.\.$)', $file)) {
    $filename[] = $file;
  }
}
$dir->close();

?>

こんな感じ。 !ereg('(^\.$)|(^\.\.$)', $file) とある行は、カレントディレクトリ（.）と、親ディレクトリを除いて処理するためのもの。 $filename[] の配列中に、ファイル一覧が入る。

<?php

$dir_path = 'your_directory';
$filename = array();

$dir = dir($dir_path);
while($file = $dir->read()) {
  if(!ereg('(^\.$)|(^\.\.$)', $file)) {
    $filename[] = $file;
  }
}
$dir->close();

?>

Posted on 2007-12-16 by yas |

Perl で、Base64 のファイルをデコードして元のバイナリファイルに戻す方法

メールに添付されてきた .pdf ファイルが巨大すぎてメールサーバによって分割されて自分のところに配信された結果、Base64 のデータがバラバラに届いたケースを考える。このような場合は Perl が活躍する。まず、バラバラになった Base64 のファイルは仕方がないのでエディタを使って手作業でくっつけて 1つのファイルにする。そのあと、以下のコマンドを実行すればよい。


使用するモジュール
use MIME::Base64;

perl -MMIME::Base64 -ne 'print decode_base64($_)' 
< くっつけたBase64ファイル名.txt > 出力ファイル名.pdf

（上は、すべて1行に書く）

MIME::Base64 - base64文字列のエンコードとデコード (perldoc.jp)

メールに添付されてきた .pdf ファイルが巨大すぎてメールサーバによって分割されて自分のところに配信された結果、Base64 のデータがバラバラに届いたケースを考える。このような場合は Perl が活躍する。まず、バラバラになった Base64 のファイルは仕方がないのでエディタを使って手作業でくっつけて 1つのファイルにする。そのあと、以下のコマンドを実行すればよい。


使用するモジュール
use MIME::Base64;

perl -MMIME::Base64 -ne 'print decode_base64($_)' 
< くっつけたBase64ファイル名.txt > 出力ファイル名.pdf

（上は、すべて1行に書く）

MIME::Base64 - base64文字列のエンコードとデコード (perldoc.jp)

Posted on 2006-06-24 by yas |

Perl で、配列中の重複レコードを削除するには？

配列の中にある重複するレコードを削除する場合、Perl なのでいろいろな方法があると思うが、以下のコードを試してみて欲しい。

#/usr/bin/perl -w

my @array = ('a', 'b', 'c', 'a');

my %count;
@array = grep {!$count{$_}++} @array;

print @array; # 出力は abc となる。

1;

配列の中にある重複するレコードを削除する場合、Perl なのでいろいろな方法があると思うが、以下のコードを試してみて欲しい。

#/usr/bin/perl -w

my @array = ('a', 'b', 'c', 'a');

my %count;
@array = grep {!$count{$_}++} @array;

print @array; # 出力は abc となる。

1;

Posted on 2006-04-22 by yas |

Perl で、1GB のデータ（テキストファイル）を作成する方法

PHP で、ディレクトリの中のファイル名を取得する方法

Perl で、Base64 のファイルをデコードして元のバイナリファイルに戻す方法

Perl で、配列中の重複レコードを削除するには？

本日の上位：

総合の上位：

最近の参照：