内射老阿姨1区2区3区4区_久久精品人人做人人爽电影蜜月_久久国产精品亚洲77777_99精品又大又爽又粗少妇毛片

基于OpenCV進(jìn)行文本分塊切割-創(chuàng)新互聯(lián)

假設(shè)有如下一張圖,如何把其中的文本分塊切割出來(lái),比如“華普超市朝陽(yáng)門(mén)店”、“2015-07-26”就是兩個(gè)文本塊。

為濟(jì)寧等地區(qū)用戶提供了全套網(wǎng)頁(yè)設(shè)計(jì)制作服務(wù),及濟(jì)寧網(wǎng)站建設(shè)行業(yè)解決方案。主營(yíng)業(yè)務(wù)為網(wǎng)站設(shè)計(jì)、網(wǎng)站制作、濟(jì)寧網(wǎng)站設(shè)計(jì),以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專(zhuān)業(yè)、用心的態(tài)度為用戶提供真誠(chéng)的服務(wù)。我們深信只要達(dá)到每一位用戶的要求,就會(huì)得到認(rèn)可,從而選擇與我們長(zhǎng)期合作。這樣,我們也可以走得更遠(yuǎn)!

基于OpenCV進(jìn)行文本分塊切割

做圖像切割有很多種方法,本文描述一種最直觀的投影檢測(cè)法。先來(lái)看看什么是投影,簡(jiǎn)單來(lái)說(shuō),投影就是在一定方向上有效像素的數(shù)量。來(lái)看個(gè)直觀的圖像:

基于OpenCV進(jìn)行文本分塊切割

這是一張水平投影圖與原圖的對(duì)比,從投影圖上能看到多個(gè)波峰,文字多的地方,投影就長(zhǎng),行間的空白處,投影為0。 上個(gè)示例代碼:

public void HorizontalProjection()
{
    //以灰度圖方式讀入源文件
    string filename = "source.jpg";
    var src = IplImage.FromFile(filename, LoadMode.GrayScale);

    //二值化,采用閾值分割法
    Cv.Threshold(src, src, 0, 255, ThresholdType.BinaryInv | ThresholdType.Otsu);

    //存儲(chǔ)投影值的數(shù)組
    var h = new int[src.Height];

    //對(duì)每一行計(jì)算投影值
    for(int y = 0;y < src.Height;++y)
    {
        //遍歷這一行的每一個(gè)像素,如果是有效的,累加投影值
        for(int x = 0;x < src.Width;++x)
        {
            var s = Cv.Get2D(src, y, x);
            if(s.Val0 == 255)
                h[y]++;
        }
    }

    //準(zhǔn)備一個(gè)圖像用于畫(huà)投影圖
    var paintY = Cv.CreateImage(src.Size, BitDepth.U8, 1);
    Cv.Zero(paintY);

    //畫(huà)圖
    var t = new CvScalar(255);
    for(int y = 0;y < src.Height;++y)
    {
        for(int x = 0;x < h[y];++x)
            Cv.Set2D(paintY, y, x, t);
    }

    //顯示
    using(var window = new CvWindow("Source"))
    {
        window.Image = src;
        using(var win2 = new CvWindow("Projection"))
        {
            win2.Image = paintY;
            Cv.WaitKey();
        }
    }
}

顯然找出波峰對(duì)應(yīng)的y值,就能把行切割開(kāi)了。 得到一行以后,可以采用類(lèi)似的思想進(jìn)行垂直投影,挑了一行測(cè)試一下,效果如下:

基于OpenCV進(jìn)行文本分塊切割

可以看到效果不是特別好,左右結(jié)構(gòu)的漢字有可能被切開(kāi),一個(gè)完整的數(shù)值也有可能分成多個(gè)數(shù)字,這種情況需要做一下處理,比如識(shí)別的時(shí)候要判斷如果間距較小就認(rèn)為仍是同一文本塊,或者對(duì)圖像進(jìn)行一下橫向膨脹處理:

var kernal = Cv.CreateStructuringElementEx(3, 1, 1, 0, ElementShape.Rect);
Cv.Dilate(src, src, kernal, 4);

再計(jì)算投影,得到的效果就好多了:

基于OpenCV進(jìn)行文本分塊切割

最后上完整代碼以及切割效果展示:

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;

using OpenCvSharp;
using OpenCvSharp.Extensions;
using OpenCvSharp.Utilities;

namespace OpenCvTest
{
    class Program
    {
        static void Main(string[] args)
        {
            //打開(kāi)源文件
            string filename = "source.jpg";
            var src = IplImage.FromFile(filename);

            //轉(zhuǎn)成灰度圖
            var gray = Cv.CreateImage(src.Size, BitDepth.U8, 1);
            Cv.CvtColor(src, gray, ColorConversion.BgrToGray);

            //二值化,閾值分割算法
            Cv.Threshold(gray, gray, 0, 255, ThresholdType.BinaryInv | ThresholdType.Otsu);

            //分行
            var rows = GetRowRects(gray);

            //針對(duì)每一行再分塊
            var items = new List<CvRect>();
            foreach (var row in rows)
            {
                var cols = GetBlockRects(gray.Clone(row), row.Y);
                items.AddRange(cols);
            }

            //把識(shí)別出的每一塊畫(huà)到原圖上去
            var color = new CvScalar(255, 0, 0);
            foreach (var rect in items)
            {
                Cv.DrawRect(src, rect, color, 1);
            }

            //顯示
            using (var window = new CvWindow("Image"))
            {
                window.Image = src;
                Cv.WaitKey();
            }
        }

        /// <summary>
        /// 識(shí)別行
        /// </summary>
        /// <param name="source"></param>
        /// <returns></returns>
        private static List<CvRect> GetRowRects(IplImage source)
        {
            var rows = new List<CvRect>();

            //用于存儲(chǔ)投影值
            var projection = new int[source.Height];

            //遍歷每一行計(jì)算投影值
            for (int y = 0; y < source.Height; ++y)
            {
                for (int x = 0; x < source.Width; ++x)
                {
                    var s = Cv.Get2D(source, y, x);
                    if (s.Val0 == 255)
                        projection[y]++;
                }
            }

            bool inLine = false;
            int start = 0;

            //開(kāi)始根據(jù)投影值識(shí)別分割點(diǎn)
            for (int i = 0; i < projection.Length; ++i)
            {
                if (!inLine && projection[i] > 10)
                {
                    //由空白進(jìn)入字符區(qū)域了,記錄標(biāo)記
                    inLine = true;
                    start = i;
                }
                else if ((i - start > 5) && projection[i] < 10 && inLine)
                {
                    //由字符區(qū)域進(jìn)入空白區(qū)域了
                    inLine = false;

                    //忽略高度太小的行,比如分隔線
                    if (i - start > 10)
                    {
                        //記錄下位置
                        var rect = new CvRect(0, start - 1 , source.Width, i - start + 2);
                        rows.Add(rect);
                    }
                }
            }
            
            return rows;
        }

        /// <summary>
        /// 識(shí)別塊
        /// </summary>
        /// <param name="source"></param>
        /// <param name="rowY"></param>
        /// <returns></returns>
        private static List<CvRect> GetBlockRects(IplImage source, int rowY)
        {
            var blocks = new List<CvRect>();

            //用于存儲(chǔ)投影值
            var projection = new int[source.Width];
            
            //先進(jìn)行橫向膨脹
            var kernal = Cv.CreateStructuringElementEx(3, 1, 1, 0, ElementShape.Rect);
            Cv.Dilate(source, source, kernal, 4);

            //遍歷每一列計(jì)算投影值
            for (int x = 0; x < source.Width; ++x)
            {
                for (int y = 0; y < source.Height; ++y)
                {
                    var s = Cv.Get2D(source, y, x);
                    if (s.Val0 == 255)
                        projection[x]++;
                }
            }

            bool inBlock = false;
            int start = 0;

            //開(kāi)始根據(jù)投影值識(shí)別分割點(diǎn)
            for (int i = 0; i < projection.Length; ++i)
            {
                if (!inBlock && projection[i] >= 2)
                {
                    //由空白區(qū)域進(jìn)入字符區(qū)域了
                    inBlock = true;
                    start = i;
                }
                else if ((i - start > 10) && inBlock && projection[i] < 2)
                {
					//由字符區(qū)域進(jìn)入空白區(qū)域了
					inBlock = false;

					//記錄位置,注意由于傳入的是source只是一行,因此最終的位置信息要+rowY
					if(blocks.Count > 0)
					{
						//跟上一個(gè)比一下,如果距離過(guò)近,認(rèn)為是同一個(gè)文本塊,合并
						var last = blocks[blocks.Count - 1];

						if (start - last.X - last.Width <= 5)
						{
							blocks.RemoveAt(blocks.Count - 1);
							var rect = new CvRect(last.X, rowY, i - last.X, source.Height);
							blocks.Add(rect);
						}
						else
						{
							var rect = new CvRect(start, rowY, i - start, source.Height);
							blocks.Add(rect);
						}
					}
					else
					{
						var rect = new CvRect(start, rowY, i - start, source.Height);
						blocks.Add(rect);
					}                }
            }

            return blocks;
        }
    }
}

得到的圖像如下,效果還行,將來(lái)繼續(xù)優(yōu)化吧:

基于OpenCV進(jìn)行文本分塊切割

未經(jīng)許可嚴(yán)禁轉(zhuǎn)載。

另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無(wú)理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專(zhuān)為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。

名稱(chēng)欄目:基于OpenCV進(jìn)行文本分塊切割-創(chuàng)新互聯(lián)
文章起源:http://www.rwnh.cn/article42/ppeec.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)網(wǎng)站建設(shè)、企業(yè)建站、網(wǎng)站排名、搜索引擎優(yōu)化營(yíng)銷(xiāo)型網(wǎng)站建設(shè)、手機(jī)網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站建設(shè)
高陵县| 库尔勒市| 交城县| 梁平县| 五河县| 宿州市| 永和县| 南投县| 讷河市| 云和县| 黑龙江省| 哈密市| 凤凰县| 克拉玛依市| 朝阳区| 布拖县| 洪湖市| 崇阳县| 鹤岗市| 舟曲县| 绥滨县| 都昌县| 汝南县| 图木舒克市| 小金县| 张家界市| 永清县| 攀枝花市| 公安县| 南岸区| 赫章县| 津市市| 闽侯县| 北流市| 文成县| 岳西县| 安图县| 慈溪市| 麻栗坡县| 石景山区| 时尚|