上传前如何使用javascript检查文件MIME类型?

IT技术 javascript html file-upload mime-types
2021-01-31 15:22:26

我已经阅读了这个这个问题,这似乎表明可以在客户端使用 javascript 检查文件 MIME 类型。现在,我明白真正的验证仍然必须在服务器端完成。我想执行客户端检查以避免不必要的服务器资源浪费。

为了测试这是否可以在客户端完成,我将JPEG测试文件的扩展名更改.png并选择要上传的文件。在发送文件之前,我使用 javascript 控制台查询文件对象:

document.getElementsByTagName('input')[0].files[0];

这是我在 Chrome 28.0 上得到的:

文件 {webkitRelativePath: "", lastModifiedDate: Tue Oct 16 2012 10:00:00 GMT+0000 (UTC), name: "test.png", type: "image/png", size: 500055…}

它显示的类型image/png似乎表明检查是基于文件扩展名而不是 MIME 类型完成的。我尝试了 Firefox 22.0,它给了我相同的结果。但是根据W3C 规范应该实现MIME 嗅探

我说目前无法使用 javascript 检查 MIME 类型是否正确?或者我错过了什么?

6个回答

在将文件FileReader上传到服务器之前,您可以使用 JavaScript 轻松确定文件 MIME 类型我同意我们应该更喜欢服务器端检查而不是客户端检查,但客户端检查仍然是可能的。我将向您展示如何操作并在底部提供一个工作演示。


检查您的浏览器是否同时支持FileBlob所有主要的都应该。

if (window.FileReader && window.Blob) {
    // All the File APIs are supported.
} else {
    // File and Blob are not supported
}

第1步:

您可以File从这样的<input>元素中检索信息( ref ):

<input type="file" id="your-files" multiple>
<script>
var control = document.getElementById("your-files");
control.addEventListener("change", function(event) {
    // When the control has changed, there are new files
    var files = control.files,
    for (var i = 0; i < files.length; i++) {
        console.log("Filename: " + files[i].name);
        console.log("Type: " + files[i].type);
        console.log("Size: " + files[i].size + " bytes");
    }
}, false);
</script>

这是上述(ref的拖放版本

<div id="your-files"></div>
<script>
var target = document.getElementById("your-files");
target.addEventListener("dragover", function(event) {
    event.preventDefault();
}, false);

target.addEventListener("drop", function(event) {
    // Cancel default actions
    event.preventDefault();
    var files = event.dataTransfer.files,
    for (var i = 0; i < files.length; i++) {
        console.log("Filename: " + files[i].name);
        console.log("Type: " + files[i].type);
        console.log("Size: " + files[i].size + " bytes");
    }
}, false);
</script>

第2步:

我们现在可以检查文件并梳理出标题和 MIME 类型。

✘ 快速方法

您可以天真地向Blob询问它使用以下模式表示的任何文件的 MIME 类型:

var blob = files[i]; // See step 1 above
console.log(blob.type);

对于图像,MIME 类型返回如下:

图像/jpeg
图像/png
...

警告: MIME 类型是从文件扩展名中检测到的,可能会被欺骗或欺骗。可以将 a 重命名.jpg为 a.png并且 MIME 类型将报告为image/png.


✓ 正确的检查头方法

为了获得客户端文件的真实 MIME 类型,我们可以更进一步,检查给定文件的前几个字节,以与所谓的幻数进行比较请注意,这并不完全简单,因为例如,JPEG有一些“神奇数字”。这是因为格式自 1991 年以来一直在发展。您可能只检查前两个字节,但我更喜欢检查至少 4 个字节以减少误报。

JPEG 的示例文件签名(前 4 个字节):

FF D8 FF E0 (SOI + ADD0)
FF D8 FF E1 (SOI + ADD1)
FF D8 FF E2 (SOI + ADD2)

这是检索文件头的基本代码:

var blob = files[i]; // See step 1 above
var fileReader = new FileReader();
fileReader.onloadend = function(e) {
  var arr = (new Uint8Array(e.target.result)).subarray(0, 4);
  var header = "";
  for(var i = 0; i < arr.length; i++) {
     header += arr[i].toString(16);
  }
  console.log(header);

  // Check the file signature against known types

};
fileReader.readAsArrayBuffer(blob);

然后您可以像这样确定真正的 MIME 类型(更多文件签名在这里这里):

switch (header) {
    case "89504e47":
        type = "image/png";
        break;
    case "47494638":
        type = "image/gif";
        break;
    case "ffd8ffe0":
    case "ffd8ffe1":
    case "ffd8ffe2":
    case "ffd8ffe3":
    case "ffd8ffe8":
        type = "image/jpeg";
        break;
    default:
        type = "unknown"; // Or you can use the blob.type as fallback
        break;
}

根据预期的 MIME 类型,根据需要接受或拒绝文件上传。


演示

这是本地文件远程文件的工作演示(为了这个演示,我不得不绕过 CORS)。打开代码片段,运行它,您应该会看到显示了三个不同类型的远程图像。您可以在顶部选择本地图像数据文件,然后将显示文件签名和/或 MIME 类型。

请注意,即使图像被重命名,也可以确定其真正的 MIME 类型。见下文。

截屏

演示的预期输出


只允许纯文本的检查应该是什么?文本文件的前 4 个字节似乎是文本文件中的前 4 个字符。
2021-03-16 15:22:26
@Deadpool 见这里来自不同制造商的 JPEG 格式更多,但不太常见。例如,FF D8 FF E2= CANNON EOS JPEG 文件,FF D8 FF E3= SAMSUNG D500 JPEG 文件。JPEG 签名的关键部分只有 2 个字节,但为了减少误报,我添加了最常见的 4 字节签名。我希望这有帮助。
2021-03-18 15:22:26
2 小意见。(1) 在读取之前将文件切成前 4 个字节不是更好吗?fileReader.readAsArrayBuffer(blob.slice(0,4))? (2) 为了复制/粘贴文件签名,标题不应该用前导 0 构造 for(var i = 0; i < bytes.length; i++) { var byte = bytes[i]; fileSignature += (byte < 10 ? "0" : "") + byte.toString(16); }吗?
2021-03-19 15:22:26
您不必将完整的 blob 作为 ArrayBuffer 加载来确定 mimeType。您可以像这样切片并传递 blob 的前 4 个字节:fileReader.readAsArrayBuffer(blob.slice(0, 4))
2021-04-05 15:22:26
这个答案的质量是惊人的。
2021-04-06 15:22:26

如其他答案所述,您可以通过检查文件首字节中的文件签名来检查 MIME 类型

但是其他答案正在做的是将整个文件加载到内存中以检查签名,这是非常浪费的,如果您不小心选择了一个大文件,很容易冻结您的浏览器。

/**
 * Load the mime type based on the signature of the first bytes of the file
 * @param  {File}   file        A instance of File
 * @param  {Function} callback  Callback with the result
 * @author Victor www.vitim.us
 * @date   2017-03-23
 */
function loadMime(file, callback) {
    
    //List of known mimes
    var mimes = [
        {
            mime: 'image/jpeg',
            pattern: [0xFF, 0xD8, 0xFF],
            mask: [0xFF, 0xFF, 0xFF],
        },
        {
            mime: 'image/png',
            pattern: [0x89, 0x50, 0x4E, 0x47],
            mask: [0xFF, 0xFF, 0xFF, 0xFF],
        }
        // you can expand this list @see https://mimesniff.spec.whatwg.org/#matching-an-image-type-pattern
    ];

    function check(bytes, mime) {
        for (var i = 0, l = mime.mask.length; i < l; ++i) {
            if ((bytes[i] & mime.mask[i]) - mime.pattern[i] !== 0) {
                return false;
            }
        }
        return true;
    }

    var blob = file.slice(0, 4); //read the first 4 bytes of the file

    var reader = new FileReader();
    reader.onloadend = function(e) {
        if (e.target.readyState === FileReader.DONE) {
            var bytes = new Uint8Array(e.target.result);

            for (var i=0, l = mimes.length; i<l; ++i) {
                if (check(bytes, mimes[i])) return callback("Mime: " + mimes[i].mime + " <br> Browser:" + file.type);
            }

            return callback("Mime: unknown <br> Browser:" + file.type);
        }
    };
    reader.readAsArrayBuffer(blob);
}


//when selecting a file on the input
fileInput.onchange = function() {
    loadMime(fileInput.files[0], function(mime) {

        //print the output to the screen
        output.innerHTML = mime;
    });
};
<input type="file" id="fileInput">
<div id="output"></div>

我认为即使出现错误也readyState将始终FileReader.DONE在事件处理程序(W3C 规范)中 - 不应该检查 if(!e.target.error)吗?
2021-03-21 15:22:26

对于不希望自己实现此功能的任何人,Sindresorhus 创建了一个可在浏览器中运行的实用程序,并为您可能需要的大多数文档提供标头到 MIME 的映射。

https://github.com/sindresorhus/file-type

您可以结合 Vitim.us 的建议,即只读取前 X 个字节以避免使用此实用程序将所有内容加载到内存中(es6 中的示例):

import fileType from 'file-type'; // or wherever you load the dependency

const blob = file.slice(0, fileType.minimumBytes);

const reader = new FileReader();
reader.onloadend = function(e) {
  if (e.target.readyState !== FileReader.DONE) {
    return;
  }

  const bytes = new Uint8Array(e.target.result);
  const { ext, mime } = fileType.fromBuffer(bytes);

  // ext is the desired extension and mime is the mimetype
};
reader.readAsArrayBuffer(blob);
对我来说,该库的最新版本不起作用,但"file-type": "12.4.0"有效,我不得不使用import * as fileType from "file-type";
2021-04-03 15:22:26

如果您只想检查上传的文件是否是图像,您可以尝试将其加载到<img>标签中以检查是否有任何错误回调。

例子:

var input = document.getElementsByTagName('input')[0];
var reader = new FileReader();

reader.onload = function (e) {
    imageExists(e.target.result, function(exists){
        if (exists) {

            // Do something with the image file.. 

        } else {

            // different file format

        }
    });
};

reader.readAsDataURL(input.files[0]);


function imageExists(url, callback) {
    var img = new Image();
    img.onload = function() { callback(true); };
    img.onerror = function() { callback(false); };
    img.src = url;
}
效果很好,我尝试了 .gif 文件上传器 hack,但它抛出了一个错误:)
2021-03-31 15:22:26

这是你必须做的

var fileVariable =document.getElementsById('fileId').files[0];

如果要检查图像文件类型,则

if(fileVariable.type.match('image.*'))
{
 alert('its an image');
}
目前不适用于:Android 版 Firefox、Android 版 Opera 和 iOS 版 Safari。 developer.mozilla.org/en-US/docs/Web/API/File/type
2021-03-27 15:22:26