類似レポート検知機能のスコアについて

WebClassでは、レポートの剽窃検知機能として、「類似レポート検知」という機能が用意されています。この機能は、提出されたレポート同士を比較して、それらの類似度をスコアとして表示することができます。

こちらのスコア算出の挙動について不可解な点があると指摘されておりましたので、今回いくつかの観点からスコアの変動について調査しました。

調査方法

  • 同じ文章にスペース・改行を入れた場合と入れない場合を比較
  • 10文字~12,000文字程度の文章をWikipediaから切り抜いて比較に使用
    • 全く違う文章・全く同じ文章それぞれで比較
    • 英語文・日本語文それぞれで比較
    • 同じ文章の繰り返しが含まれる・含まれない文章で比較(引用の多いレポートを想定)

調査結果

  1. スペース・改行はスコアに影響する。
    • 同じ文章でもスペースが抜けるだけで5~10程度スコアが低くなる
  2. テキストの長さによりスコアが変動する。(図1,2)
    • 基本はテキストが長くなるにつれスコアが下がる傾向
    • 極端にテキストが短い場合に、極端にスコアが高く
  3. 全体的に日本語文のほうが、スコアがはっきりする。
    • 違う文章のスコアが低い(図1)
    • 同じ文章のスコアが高い(図2)
  4. 同じ文章を繰り返し使うとスコアが高くなる。(図2 緑線)
    • 重複によるスコアが積み重なる?


      図1: 全く違う文章の比較


      図2: 全く同じ文章の比較

まとめ

今回の調査から、スペースや改行・文の長さ・英語文日本語文などの違いでスコアに5~10程度の変動があることが分かりました。そのため、これらの挙動を把握した上で、あるいはある程度の誤差をご承知の上ご使用されることをおすすめします。また、100文字程度以下の短い文章では異常なスコアが出ることから、この機能に使うレポートは100文字以上になっているものを対象にすることをおすすめします。(レポート課題作成時に「100文字以上」の文字数制限を付けることも可能です。)

今回の結果から、図3の「スコアの目安(旧)」にある「強い剽窃の疑いがあります」のレベルに達するのが、繰り返しが含まれるい場合や極端に文章が短い場合のみであることがかったので、このスコア区分をv11.9.0で図4のように修正しました。スコアが70程度あれば、かなり強い剽窃である可能性があるということをご留意してお使いいただければと思います。


    図3: スコアの目安(旧)


    図4: スコアの目安(新)

Does size matter?

画像サイズを手早く取得したい (in Mac)

小ネタです。

HTML とそこからリンクされた画像ファイルが沢山あって、画像ピクセルサイズを調べて HTML に書き込んでいく必要があったんです。(これ対策。)

どこまで簡略化できるか考えた結果、Automator を利用して以下の手順になりました。

  1. Finder 上で画像を選択しショートカットキーを押すと、サイズがクリップボードに入る
  2. HTML にペースト

サイズ自動挿入とまではいけませんが、まあまあ手軽になったんじゃないでしょうか。どうやったかシェアします。

ImageMagick インストール

コマンドラインで画像サイズを取得するので、ImageMagick をインストール。
file コマンドの結果をパースしてもいいんですが、楽な方でいきます。

$ brew install imagemagick

すると identity コマンドがインストールされているはず。

$ identify -format 'width=%w,height=%h' image.jpg
width=600,height=600% 

Automator でコンテキストメニュー追加

  1. Automator 起動。
  2. ⌘ + N で新規作成。
  3. "Quick Action" を選択して Choose。Quick Action
  4. 右パネルで、Workflow receives current "image files" in Finder を選択。
  5. 左パネルの検索欄に "Run Shell Script" と入力すると出てくる "Run Shell Script" をダブルクリック。
  6. Pass input を "as arguments" に変更。
  7. コマンドに以下のように入力。フォーマットは自由に変更できます。
    for f in "$@"
    do
    /usr/local/bin/identify -format 'width=%w,height=%h' "$f" | pbcopy
    done

    Script

  8. ⌘ + S で保存、"Copy image size" と名前をつける。

ここまで上手く行ったか確認してみましょう。Finder 上で画像ファイルを右クリックし、"Quick Action" に "Copy image size" が出るでしょうか?
選択した後、どこかテキスト入力欄で ⌘ + V を押してペーストしてみてください。width=600,height=600 みたいな文字が入力されれば成功です。

ショートカットキー設定

右クリックメニューから選択するのはだるいので、ショートカットキーを設定します。

  1. システム設定を開く。
  2. Keyboard > Shortcuts を開く。
  3. Services の中にある "Copy image size" を選択。
  4. "Add Shortcut" を押して設定したいキー(自分は ⌘ + Ctrl + Shift + C にしました)を入力。

以上で設定完了です。

使い方

Finderで画像ファイルを選び、設定したショートカットキーを入力すると、画像サイズがクリップボードに入り、ペーストできます。
ま、それだけです。

まとめ

Mac ユーザーでも Automator って中々知る機会がない気がしますがどうでしょう。
いざ有効活用できる機会が来た時に存在を思い出せる程度には記憶にとどめておきたい。
実際のところ、HTML と実ファイルの対応関係を認識している IDE だったら、自動的に HTML を更新できるんじゃないか、IDE のプラグインを作れば良いんじゃないかと思っていますが、また時間のある時に試してみます。

撮影した講義動画をWebClassで公開する方法

本日リリースしたWebClass v11.8.2で、以下の変更があります。

HLS_OPTIONが有効の環境で、資料やテストの取り込みファイルとしてMOV(H.264)形式の動画ファイルをアップロードした際に、ストリーミング配信(HLS)するようにしました。

この変更によって、iPhoneやiPadで撮影した撮影した動画をそのままWebClassに載せてストリーミング配信することができるようになります。そこでこの記事では、具体的な動画の公開手順を解説します。

ただし、以下で詳細を説明しますが、動画のサイズには注意が必要です。制限があるため、自身の環境で動画配信を実現できるかよく確認してください。

前提

注意点

一度にアップロードできる動画サイズには制限があり、上限は学校によって異なります。試しに手元のiPadで撮影した1分の動画は15MB程になりました。15分で225MB、30分で450MB程になる計算です。適時分割しないとアップロードできないかもしれません。

また、サーバーの容量に限りがあるため、大量の動画を一気にアップロードすると問題になることがあります。

動画公開手順

ここでは、iPadで動画を撮影し、そのままWebClassにアップロードすることにします。Androidでも基本的な操作は同様です。

1. 動画を撮る

iPadで講義を撮影します。

授業動画

  • iPadやiPhoneを縦向きにした状態で動画を撮ってWebClassにアップロードすると、90度傾いた状態で配信されてしまう問題があることが分かっています。横向きで動画を撮影してください。

2. WebClassにログインする

iPadのブラウザSafariを開き、自校のWebClassのページを開きます。

3. 自分のコースを開く

参加しているコースから、動画を公開したいコースを選んで開きます。

参加しているコース一覧

4. 動画資料を作成する

[教材を作成する]ボタンを押します。

教材作成ボタン

教材の種別を選択する画面が表示されます。「資料」を選びます。

資料のタイトルを入力します。

[資料作成: ページ編集]ボタンを押します。

資料の内容を編集する画面が表示されます。
下のイメージのように、画面右上あたりのエリアをスクロールして、「取り込みファイル」の欄を探します。[ファイルを選択]ボタンを押します。

撮影済みの動画を選ぶために、「フォトライブラリ」を選びます。

「ビデオ」を選びます。

保存されている動画から、公開したい動画を選んだ後、「完了」を押します。

「使用」を押します。

[変更を保存して終了]ボタンを押します。

動画資料が作成できました。

5. 動作確認する

ちゃんと再生できるか確認してみましょう。作成した動画資料を選びます。

画面右に動画が表示されます。矢印を押して動画が再生されればOKです。

その他、操作等で分からないことがあれば、先生向け資料を公開していますのでご利用ください。

学生の携帯の通信量プラン

こんにちは。福岡です。

学校で対面授業ができない代わりにオンラインの学習ツール利用が進むと思いますが、学生の通信費負担について、以下の通り支援プランが出ているようです。

ドコモ https://www.nttdocomo.co.jp/info/notice/page/200403_00.html

au https://news.kddi.com/kddi/corporate/newsrelease/2020/04/03/4364.html

softbank https://www.softbank.jp/corp/news/info/2020/20200403_01/

通信量は既に多方面で増大しているそうで、動画サービスでも帯域を絞るなどして対応しているようです。

Brace for the usage rising

こんにちは。福岡です。

昨日は4月の大学授業スタートに向けて、テレビ会議ソフトを使うことを想定してZoom.usを調べました。テレビ会議は他にも、Cisco Webex や Microsoft Teams などいくつかあると思います。

今日は別の視点から、今動いている WebClass について、単純にアクセスが増えたら大丈夫だろうか? という点について書きます。

「利用が増える」とは

まずは、どう考えるか、どこに着手すべきか、全体を整理したいと思います。

利用増と言っても、まずは以下のようにいくつか観点があります

  • 一部学科・学部等で使っていたが、利用者の公開範囲を拡大したい
  • 一部ネットワークのみ公開して使っていたが、家からの利用も許可したい
  • 登録ユーザ数やコース数は同じだが、実際に使う先生や授業、もしくは頻度が増えそう
  • 今までも広く利用されていたが、利用形態がよりヘビーに(例えば動画をアップロードしたり、WebClassでのレポート受付が増える)かも

実際どうなるか、わかるところもあれば、わからないところもあるはずです。まずすべきことは、今わかることを点検しておくことではないでしょうか。

登録人数が増えるとき

これまでに公開していなかった先生や学生にも公開する場合、アカウントや授業の登録が必要になります。

  • 大学側で一括登録している場合は、増やすと決めれば確実に増えるはずです。その場合、登録の処理について確認しておく必要があります。
  • もし利用申請制にしている場合は、申請・承認処理の処理能力を考慮しておく必要があると思います。
  • また、もし認証にLDAP/ADなどの連携をしている場合は、そちらも対応できるか確認する必要があります。

もし実際に人数を増やす場合、普通は授業開始前に一気に処理しないといけなくなる可能性が高いです。

アクセスの公開範囲を広げるとき

もしかしたら、学内からのみ利用許可しているかもしれません。公開範囲を広げる場合は、アクセスする URL につかう FQDN やグローバルIP、FW や SSL による暗号化などを検討しておく必要があると思います。

もしくは、場合によっては教材がローカルIPを使ったURLでリンクなどしているかもしれません。

また、もし学内PCからのみ利用していた場合、ブラウザや利用環境がかなり均一化されていたはずです。学生や先生が家のPCのブラウザで利用したときに、慣れないユーザから利用方法の問い合わせがあるかもしれません。

実際に使う先生が増えるとき

サーバ等の性能の話は後にします。ここで先に考えるのは、この機会に使い始める先生のフォローです。ちょっとした資料提示に使ってはいたけど、もっと細かく使うことになったとき、どうしたらいいだろう? と思う先生もいらっしゃるかもしれません。

こちらでも、改めて使い方をまとめて行っています。
https://webclass.jp/documents/course-manage

また、これまでよく使っていただいた先生方にとっても、今回のウイルスへの対応で、新しい使い方に挑まなくてはならないケースも発生すると思います。

遠隔授業を手っ取り早く行うには、テレビ会議ソフトが使えるかもしれません。それはこちらでZoomを紹介しています。

https://webclass.jp/blog/2020/03/18/lts-integration-with-cisco-webex/

よりヘビーに使われたら

もし、よりヘビーに使われることになったら、以下のところのどこかにボトルネックが発生するかもしれません。ここでは、システム的な面で考えます。

  • ネットワークトラフィック
  • WebClassサーバ処理性能
    • Web
    • DB
  • ディスクの残り容量
  • LB のタイムアウト時間

スペックは足りるのか?

利用規模を想定するのはなかなか難しいといつも思います。4月に利用増を見込むと言っても、それがどれくらいか、わからないところも多いのではないでしょうか。スペックがどれくらいだったら足りるのか、どれだけお金をかけるのか、なかなか決めづらいと思います。

もし WebClass の利用状況について、これまでモニタリングをしていない学校であれば、まずは監視をしてサーバの使用状況を確認できるようにしてはいかがでしょうか。

死活監視については、以前に書いた記事があります。

https://webclass.jp/blog/2019/02/07/webclassログイン画面のhttp-status/

学校によっては既に Zabbix 等を使って統合監視をしていると思いますが、そこまではすぐに準備できないという学校であれば、munin はいかがでしょう。

https://knowledge.sakura.ad.jp/3669/

munin は比較的お手軽に導入でき、見やすくていいと思います。ただし、この手の監視ツールも動かす分だけCPUやDisk負荷は食うということを頭に入れておく必要があります。