xref: /openbmc/linux/lib/lzo/lzo1x_compress.c (revision 45ec975efb527625629d123f30597673889f52ca)
164c70b1cSRichard Purdie /*
28b975bd3SMarkus F.X.J. Oberhumer  *  LZO1X Compressor from LZO
364c70b1cSRichard Purdie  *
48b975bd3SMarkus F.X.J. Oberhumer  *  Copyright (C) 1996-2012 Markus F.X.J. Oberhumer <markus@oberhumer.com>
564c70b1cSRichard Purdie  *
664c70b1cSRichard Purdie  *  The full LZO package can be found at:
764c70b1cSRichard Purdie  *  http://www.oberhumer.com/opensource/lzo/
864c70b1cSRichard Purdie  *
98b975bd3SMarkus F.X.J. Oberhumer  *  Changed for Linux kernel use by:
1064c70b1cSRichard Purdie  *  Nitin Gupta <nitingupta910@gmail.com>
1164c70b1cSRichard Purdie  *  Richard Purdie <rpurdie@openedhand.com>
1264c70b1cSRichard Purdie  */
1364c70b1cSRichard Purdie 
1464c70b1cSRichard Purdie #include <linux/module.h>
1564c70b1cSRichard Purdie #include <linux/kernel.h>
1664c70b1cSRichard Purdie #include <asm/unaligned.h>
178b975bd3SMarkus F.X.J. Oberhumer #include <linux/lzo.h>
1864c70b1cSRichard Purdie #include "lzodefs.h"
1964c70b1cSRichard Purdie 
2064c70b1cSRichard Purdie static noinline size_t
218b975bd3SMarkus F.X.J. Oberhumer lzo1x_1_do_compress(const unsigned char *in, size_t in_len,
228b975bd3SMarkus F.X.J. Oberhumer 		    unsigned char *out, size_t *out_len,
23*45ec975eSDave Rodgman 		    size_t ti, void *wrkmem, signed char *state_offset,
24*45ec975eSDave Rodgman 		    const unsigned char bitstream_version)
2564c70b1cSRichard Purdie {
268b975bd3SMarkus F.X.J. Oberhumer 	const unsigned char *ip;
278b975bd3SMarkus F.X.J. Oberhumer 	unsigned char *op;
2864c70b1cSRichard Purdie 	const unsigned char * const in_end = in + in_len;
298b975bd3SMarkus F.X.J. Oberhumer 	const unsigned char * const ip_end = in + in_len - 20;
308b975bd3SMarkus F.X.J. Oberhumer 	const unsigned char *ii;
318b975bd3SMarkus F.X.J. Oberhumer 	lzo_dict_t * const dict = (lzo_dict_t *) wrkmem;
3264c70b1cSRichard Purdie 
338b975bd3SMarkus F.X.J. Oberhumer 	op = out;
348b975bd3SMarkus F.X.J. Oberhumer 	ip = in;
358b975bd3SMarkus F.X.J. Oberhumer 	ii = ip;
368b975bd3SMarkus F.X.J. Oberhumer 	ip += ti < 4 ? 4 - ti : 0;
3764c70b1cSRichard Purdie 
3864c70b1cSRichard Purdie 	for (;;) {
395ee4014aSDave Rodgman 		const unsigned char *m_pos = NULL;
408b975bd3SMarkus F.X.J. Oberhumer 		size_t t, m_len, m_off;
418b975bd3SMarkus F.X.J. Oberhumer 		u32 dv;
425ee4014aSDave Rodgman 		u32 run_length = 0;
4364c70b1cSRichard Purdie literal:
448b975bd3SMarkus F.X.J. Oberhumer 		ip += 1 + ((ip - ii) >> 5);
458b975bd3SMarkus F.X.J. Oberhumer next:
4664c70b1cSRichard Purdie 		if (unlikely(ip >= ip_end))
4764c70b1cSRichard Purdie 			break;
488b975bd3SMarkus F.X.J. Oberhumer 		dv = get_unaligned_le32(ip);
495ee4014aSDave Rodgman 
50*45ec975eSDave Rodgman 		if (dv == 0 && bitstream_version) {
515ee4014aSDave Rodgman 			const unsigned char *ir = ip + 4;
525ee4014aSDave Rodgman 			const unsigned char *limit = ip_end
535ee4014aSDave Rodgman 				< (ip + MAX_ZERO_RUN_LENGTH + 1)
545ee4014aSDave Rodgman 				? ip_end : ip + MAX_ZERO_RUN_LENGTH + 1;
555ee4014aSDave Rodgman #if defined(CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS) && \
565ee4014aSDave Rodgman 	defined(LZO_FAST_64BIT_MEMORY_ACCESS)
575ee4014aSDave Rodgman 			u64 dv64;
585ee4014aSDave Rodgman 
595ee4014aSDave Rodgman 			for (; (ir + 32) <= limit; ir += 32) {
605ee4014aSDave Rodgman 				dv64 = get_unaligned((u64 *)ir);
615ee4014aSDave Rodgman 				dv64 |= get_unaligned((u64 *)ir + 1);
625ee4014aSDave Rodgman 				dv64 |= get_unaligned((u64 *)ir + 2);
635ee4014aSDave Rodgman 				dv64 |= get_unaligned((u64 *)ir + 3);
645ee4014aSDave Rodgman 				if (dv64)
655ee4014aSDave Rodgman 					break;
665ee4014aSDave Rodgman 			}
675ee4014aSDave Rodgman 			for (; (ir + 8) <= limit; ir += 8) {
685ee4014aSDave Rodgman 				dv64 = get_unaligned((u64 *)ir);
695ee4014aSDave Rodgman 				if (dv64) {
705ee4014aSDave Rodgman #  if defined(__LITTLE_ENDIAN)
715ee4014aSDave Rodgman 					ir += __builtin_ctzll(dv64) >> 3;
725ee4014aSDave Rodgman #  elif defined(__BIG_ENDIAN)
735ee4014aSDave Rodgman 					ir += __builtin_clzll(dv64) >> 3;
745ee4014aSDave Rodgman #  else
755ee4014aSDave Rodgman #    error "missing endian definition"
765ee4014aSDave Rodgman #  endif
775ee4014aSDave Rodgman 					break;
785ee4014aSDave Rodgman 				}
795ee4014aSDave Rodgman 			}
805ee4014aSDave Rodgman #else
815ee4014aSDave Rodgman 			while ((ir < (const unsigned char *)
825ee4014aSDave Rodgman 					ALIGN((uintptr_t)ir, 4)) &&
835ee4014aSDave Rodgman 					(ir < limit) && (*ir == 0))
845ee4014aSDave Rodgman 				ir++;
855ee4014aSDave Rodgman 			for (; (ir + 4) <= limit; ir += 4) {
865ee4014aSDave Rodgman 				dv = *((u32 *)ir);
875ee4014aSDave Rodgman 				if (dv) {
885ee4014aSDave Rodgman #  if defined(__LITTLE_ENDIAN)
895ee4014aSDave Rodgman 					ir += __builtin_ctz(dv) >> 3;
905ee4014aSDave Rodgman #  elif defined(__BIG_ENDIAN)
915ee4014aSDave Rodgman 					ir += __builtin_clz(dv) >> 3;
925ee4014aSDave Rodgman #  else
935ee4014aSDave Rodgman #    error "missing endian definition"
945ee4014aSDave Rodgman #  endif
955ee4014aSDave Rodgman 					break;
965ee4014aSDave Rodgman 				}
975ee4014aSDave Rodgman 			}
985ee4014aSDave Rodgman #endif
995ee4014aSDave Rodgman 			while (likely(ir < limit) && unlikely(*ir == 0))
1005ee4014aSDave Rodgman 				ir++;
1015ee4014aSDave Rodgman 			run_length = ir - ip;
1025ee4014aSDave Rodgman 			if (run_length > MAX_ZERO_RUN_LENGTH)
1035ee4014aSDave Rodgman 				run_length = MAX_ZERO_RUN_LENGTH;
1045ee4014aSDave Rodgman 		} else {
1058b975bd3SMarkus F.X.J. Oberhumer 			t = ((dv * 0x1824429d) >> (32 - D_BITS)) & D_MASK;
1068b975bd3SMarkus F.X.J. Oberhumer 			m_pos = in + dict[t];
1078b975bd3SMarkus F.X.J. Oberhumer 			dict[t] = (lzo_dict_t) (ip - in);
1088b975bd3SMarkus F.X.J. Oberhumer 			if (unlikely(dv != get_unaligned_le32(m_pos)))
1098b975bd3SMarkus F.X.J. Oberhumer 				goto literal;
1105ee4014aSDave Rodgman 		}
11164c70b1cSRichard Purdie 
1128b975bd3SMarkus F.X.J. Oberhumer 		ii -= ti;
1138b975bd3SMarkus F.X.J. Oberhumer 		ti = 0;
1148b975bd3SMarkus F.X.J. Oberhumer 		t = ip - ii;
1158b975bd3SMarkus F.X.J. Oberhumer 		if (t != 0) {
11664c70b1cSRichard Purdie 			if (t <= 3) {
1175ee4014aSDave Rodgman 				op[*state_offset] |= t;
1188b975bd3SMarkus F.X.J. Oberhumer 				COPY4(op, ii);
1198b975bd3SMarkus F.X.J. Oberhumer 				op += t;
1208b975bd3SMarkus F.X.J. Oberhumer 			} else if (t <= 16) {
1218b975bd3SMarkus F.X.J. Oberhumer 				*op++ = (t - 3);
1228b975bd3SMarkus F.X.J. Oberhumer 				COPY8(op, ii);
1238b975bd3SMarkus F.X.J. Oberhumer 				COPY8(op + 8, ii + 8);
1248b975bd3SMarkus F.X.J. Oberhumer 				op += t;
1258b975bd3SMarkus F.X.J. Oberhumer 			} else {
1268b975bd3SMarkus F.X.J. Oberhumer 				if (t <= 18) {
12764c70b1cSRichard Purdie 					*op++ = (t - 3);
12864c70b1cSRichard Purdie 				} else {
12964c70b1cSRichard Purdie 					size_t tt = t - 18;
13064c70b1cSRichard Purdie 					*op++ = 0;
1318b975bd3SMarkus F.X.J. Oberhumer 					while (unlikely(tt > 255)) {
13264c70b1cSRichard Purdie 						tt -= 255;
13364c70b1cSRichard Purdie 						*op++ = 0;
13464c70b1cSRichard Purdie 					}
13564c70b1cSRichard Purdie 					*op++ = tt;
13664c70b1cSRichard Purdie 				}
13764c70b1cSRichard Purdie 				do {
1388b975bd3SMarkus F.X.J. Oberhumer 					COPY8(op, ii);
1398b975bd3SMarkus F.X.J. Oberhumer 					COPY8(op + 8, ii + 8);
1408b975bd3SMarkus F.X.J. Oberhumer 					op += 16;
1418b975bd3SMarkus F.X.J. Oberhumer 					ii += 16;
1428b975bd3SMarkus F.X.J. Oberhumer 					t -= 16;
1438b975bd3SMarkus F.X.J. Oberhumer 				} while (t >= 16);
1448b975bd3SMarkus F.X.J. Oberhumer 				if (t > 0) do {
14564c70b1cSRichard Purdie 					*op++ = *ii++;
14664c70b1cSRichard Purdie 				} while (--t > 0);
14764c70b1cSRichard Purdie 			}
1488b975bd3SMarkus F.X.J. Oberhumer 		}
14964c70b1cSRichard Purdie 
1505ee4014aSDave Rodgman 		if (unlikely(run_length)) {
1515ee4014aSDave Rodgman 			ip += run_length;
1525ee4014aSDave Rodgman 			run_length -= MIN_ZERO_RUN_LENGTH;
1535ee4014aSDave Rodgman 			put_unaligned_le32((run_length << 21) | 0xfffc18
1545ee4014aSDave Rodgman 					   | (run_length & 0x7), op);
1555ee4014aSDave Rodgman 			op += 4;
1565ee4014aSDave Rodgman 			run_length = 0;
1575ee4014aSDave Rodgman 			*state_offset = -3;
1585ee4014aSDave Rodgman 			goto finished_writing_instruction;
1595ee4014aSDave Rodgman 		}
1605ee4014aSDave Rodgman 
1618b975bd3SMarkus F.X.J. Oberhumer 		m_len = 4;
1628b975bd3SMarkus F.X.J. Oberhumer 		{
1638b975bd3SMarkus F.X.J. Oberhumer #if defined(CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS) && defined(LZO_USE_CTZ64)
1648b975bd3SMarkus F.X.J. Oberhumer 		u64 v;
1658b975bd3SMarkus F.X.J. Oberhumer 		v = get_unaligned((const u64 *) (ip + m_len)) ^
1668b975bd3SMarkus F.X.J. Oberhumer 		    get_unaligned((const u64 *) (m_pos + m_len));
1678b975bd3SMarkus F.X.J. Oberhumer 		if (unlikely(v == 0)) {
1688b975bd3SMarkus F.X.J. Oberhumer 			do {
1698b975bd3SMarkus F.X.J. Oberhumer 				m_len += 8;
1708b975bd3SMarkus F.X.J. Oberhumer 				v = get_unaligned((const u64 *) (ip + m_len)) ^
1718b975bd3SMarkus F.X.J. Oberhumer 				    get_unaligned((const u64 *) (m_pos + m_len));
1728b975bd3SMarkus F.X.J. Oberhumer 				if (unlikely(ip + m_len >= ip_end))
1738b975bd3SMarkus F.X.J. Oberhumer 					goto m_len_done;
1748b975bd3SMarkus F.X.J. Oberhumer 			} while (v == 0);
1758b975bd3SMarkus F.X.J. Oberhumer 		}
1768b975bd3SMarkus F.X.J. Oberhumer #  if defined(__LITTLE_ENDIAN)
1778b975bd3SMarkus F.X.J. Oberhumer 		m_len += (unsigned) __builtin_ctzll(v) / 8;
1788b975bd3SMarkus F.X.J. Oberhumer #  elif defined(__BIG_ENDIAN)
1798b975bd3SMarkus F.X.J. Oberhumer 		m_len += (unsigned) __builtin_clzll(v) / 8;
1808b975bd3SMarkus F.X.J. Oberhumer #  else
1818b975bd3SMarkus F.X.J. Oberhumer #    error "missing endian definition"
1828b975bd3SMarkus F.X.J. Oberhumer #  endif
1838b975bd3SMarkus F.X.J. Oberhumer #elif defined(CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS) && defined(LZO_USE_CTZ32)
1848b975bd3SMarkus F.X.J. Oberhumer 		u32 v;
1858b975bd3SMarkus F.X.J. Oberhumer 		v = get_unaligned((const u32 *) (ip + m_len)) ^
1868b975bd3SMarkus F.X.J. Oberhumer 		    get_unaligned((const u32 *) (m_pos + m_len));
1878b975bd3SMarkus F.X.J. Oberhumer 		if (unlikely(v == 0)) {
1888b975bd3SMarkus F.X.J. Oberhumer 			do {
1898b975bd3SMarkus F.X.J. Oberhumer 				m_len += 4;
1908b975bd3SMarkus F.X.J. Oberhumer 				v = get_unaligned((const u32 *) (ip + m_len)) ^
1918b975bd3SMarkus F.X.J. Oberhumer 				    get_unaligned((const u32 *) (m_pos + m_len));
1928b975bd3SMarkus F.X.J. Oberhumer 				if (v != 0)
1938b975bd3SMarkus F.X.J. Oberhumer 					break;
1948b975bd3SMarkus F.X.J. Oberhumer 				m_len += 4;
1958b975bd3SMarkus F.X.J. Oberhumer 				v = get_unaligned((const u32 *) (ip + m_len)) ^
1968b975bd3SMarkus F.X.J. Oberhumer 				    get_unaligned((const u32 *) (m_pos + m_len));
1978b975bd3SMarkus F.X.J. Oberhumer 				if (unlikely(ip + m_len >= ip_end))
1988b975bd3SMarkus F.X.J. Oberhumer 					goto m_len_done;
1998b975bd3SMarkus F.X.J. Oberhumer 			} while (v == 0);
2008b975bd3SMarkus F.X.J. Oberhumer 		}
2018b975bd3SMarkus F.X.J. Oberhumer #  if defined(__LITTLE_ENDIAN)
2028b975bd3SMarkus F.X.J. Oberhumer 		m_len += (unsigned) __builtin_ctz(v) / 8;
2038b975bd3SMarkus F.X.J. Oberhumer #  elif defined(__BIG_ENDIAN)
2048b975bd3SMarkus F.X.J. Oberhumer 		m_len += (unsigned) __builtin_clz(v) / 8;
2058b975bd3SMarkus F.X.J. Oberhumer #  else
2068b975bd3SMarkus F.X.J. Oberhumer #    error "missing endian definition"
2078b975bd3SMarkus F.X.J. Oberhumer #  endif
2088b975bd3SMarkus F.X.J. Oberhumer #else
2098b975bd3SMarkus F.X.J. Oberhumer 		if (unlikely(ip[m_len] == m_pos[m_len])) {
2108b975bd3SMarkus F.X.J. Oberhumer 			do {
2118b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2128b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2138b975bd3SMarkus F.X.J. Oberhumer 					break;
2148b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2158b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2168b975bd3SMarkus F.X.J. Oberhumer 					break;
2178b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2188b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2198b975bd3SMarkus F.X.J. Oberhumer 					break;
2208b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2218b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2228b975bd3SMarkus F.X.J. Oberhumer 					break;
2238b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2248b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2258b975bd3SMarkus F.X.J. Oberhumer 					break;
2268b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2278b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2288b975bd3SMarkus F.X.J. Oberhumer 					break;
2298b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2308b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2318b975bd3SMarkus F.X.J. Oberhumer 					break;
2328b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2338b975bd3SMarkus F.X.J. Oberhumer 				if (unlikely(ip + m_len >= ip_end))
2348b975bd3SMarkus F.X.J. Oberhumer 					goto m_len_done;
2358b975bd3SMarkus F.X.J. Oberhumer 			} while (ip[m_len] == m_pos[m_len]);
2368b975bd3SMarkus F.X.J. Oberhumer 		}
2378b975bd3SMarkus F.X.J. Oberhumer #endif
2388b975bd3SMarkus F.X.J. Oberhumer 		}
2398b975bd3SMarkus F.X.J. Oberhumer m_len_done:
24064c70b1cSRichard Purdie 
2418b975bd3SMarkus F.X.J. Oberhumer 		m_off = ip - m_pos;
2428b975bd3SMarkus F.X.J. Oberhumer 		ip += m_len;
2438b975bd3SMarkus F.X.J. Oberhumer 		if (m_len <= M2_MAX_LEN && m_off <= M2_MAX_OFFSET) {
24464c70b1cSRichard Purdie 			m_off -= 1;
2458b975bd3SMarkus F.X.J. Oberhumer 			*op++ = (((m_len - 1) << 5) | ((m_off & 7) << 2));
24664c70b1cSRichard Purdie 			*op++ = (m_off >> 3);
24764c70b1cSRichard Purdie 		} else if (m_off <= M3_MAX_OFFSET) {
24864c70b1cSRichard Purdie 			m_off -= 1;
2498b975bd3SMarkus F.X.J. Oberhumer 			if (m_len <= M3_MAX_LEN)
25064c70b1cSRichard Purdie 				*op++ = (M3_MARKER | (m_len - 2));
2518b975bd3SMarkus F.X.J. Oberhumer 			else {
2528b975bd3SMarkus F.X.J. Oberhumer 				m_len -= M3_MAX_LEN;
25364c70b1cSRichard Purdie 				*op++ = M3_MARKER | 0;
2548b975bd3SMarkus F.X.J. Oberhumer 				while (unlikely(m_len > 255)) {
25564c70b1cSRichard Purdie 					m_len -= 255;
25664c70b1cSRichard Purdie 					*op++ = 0;
25764c70b1cSRichard Purdie 				}
25864c70b1cSRichard Purdie 				*op++ = (m_len);
25964c70b1cSRichard Purdie 			}
2608b975bd3SMarkus F.X.J. Oberhumer 			*op++ = (m_off << 2);
2618b975bd3SMarkus F.X.J. Oberhumer 			*op++ = (m_off >> 6);
2628b975bd3SMarkus F.X.J. Oberhumer 		} else {
2638b975bd3SMarkus F.X.J. Oberhumer 			m_off -= 0x4000;
2648b975bd3SMarkus F.X.J. Oberhumer 			if (m_len <= M4_MAX_LEN)
2658b975bd3SMarkus F.X.J. Oberhumer 				*op++ = (M4_MARKER | ((m_off >> 11) & 8)
2668b975bd3SMarkus F.X.J. Oberhumer 						| (m_len - 2));
2678b975bd3SMarkus F.X.J. Oberhumer 			else {
2688b975bd3SMarkus F.X.J. Oberhumer 				m_len -= M4_MAX_LEN;
2698b975bd3SMarkus F.X.J. Oberhumer 				*op++ = (M4_MARKER | ((m_off >> 11) & 8));
2708b975bd3SMarkus F.X.J. Oberhumer 				while (unlikely(m_len > 255)) {
2718b975bd3SMarkus F.X.J. Oberhumer 					m_len -= 255;
2728b975bd3SMarkus F.X.J. Oberhumer 					*op++ = 0;
27364c70b1cSRichard Purdie 				}
2748b975bd3SMarkus F.X.J. Oberhumer 				*op++ = (m_len);
2758b975bd3SMarkus F.X.J. Oberhumer 			}
2768b975bd3SMarkus F.X.J. Oberhumer 			*op++ = (m_off << 2);
27764c70b1cSRichard Purdie 			*op++ = (m_off >> 6);
27864c70b1cSRichard Purdie 		}
2795ee4014aSDave Rodgman 		*state_offset = -2;
2805ee4014aSDave Rodgman finished_writing_instruction:
2815ee4014aSDave Rodgman 		ii = ip;
2828b975bd3SMarkus F.X.J. Oberhumer 		goto next;
28364c70b1cSRichard Purdie 	}
28464c70b1cSRichard Purdie 	*out_len = op - out;
2858b975bd3SMarkus F.X.J. Oberhumer 	return in_end - (ii - ti);
28664c70b1cSRichard Purdie }
28764c70b1cSRichard Purdie 
288*45ec975eSDave Rodgman int lzogeneric1x_1_compress(const unsigned char *in, size_t in_len,
2898b975bd3SMarkus F.X.J. Oberhumer 		     unsigned char *out, size_t *out_len,
290*45ec975eSDave Rodgman 		     void *wrkmem, const unsigned char bitstream_version)
29164c70b1cSRichard Purdie {
2928b975bd3SMarkus F.X.J. Oberhumer 	const unsigned char *ip = in;
29364c70b1cSRichard Purdie 	unsigned char *op = out;
2948b975bd3SMarkus F.X.J. Oberhumer 	size_t l = in_len;
2958b975bd3SMarkus F.X.J. Oberhumer 	size_t t = 0;
2965ee4014aSDave Rodgman 	signed char state_offset = -2;
297*45ec975eSDave Rodgman 	unsigned int m4_max_offset;
2985ee4014aSDave Rodgman 
2995ee4014aSDave Rodgman 	// LZO v0 will never write 17 as first byte,
3005ee4014aSDave Rodgman 	// so this is used to version the bitstream
301*45ec975eSDave Rodgman 	if (bitstream_version > 0) {
3025ee4014aSDave Rodgman 		*op++ = 17;
303*45ec975eSDave Rodgman 		*op++ = bitstream_version;
304*45ec975eSDave Rodgman 		m4_max_offset = M4_MAX_OFFSET_V1;
305*45ec975eSDave Rodgman 	} else {
306*45ec975eSDave Rodgman 		m4_max_offset = M4_MAX_OFFSET_V0;
307*45ec975eSDave Rodgman 	}
30864c70b1cSRichard Purdie 
3098b975bd3SMarkus F.X.J. Oberhumer 	while (l > 20) {
310*45ec975eSDave Rodgman 		size_t ll = l <= (m4_max_offset + 1) ? l : (m4_max_offset + 1);
3118b975bd3SMarkus F.X.J. Oberhumer 		uintptr_t ll_end = (uintptr_t) ip + ll;
3128b975bd3SMarkus F.X.J. Oberhumer 		if ((ll_end + ((t + ll) >> 5)) <= ll_end)
3138b975bd3SMarkus F.X.J. Oberhumer 			break;
3148b975bd3SMarkus F.X.J. Oberhumer 		BUILD_BUG_ON(D_SIZE * sizeof(lzo_dict_t) > LZO1X_1_MEM_COMPRESS);
3158b975bd3SMarkus F.X.J. Oberhumer 		memset(wrkmem, 0, D_SIZE * sizeof(lzo_dict_t));
316*45ec975eSDave Rodgman 		t = lzo1x_1_do_compress(ip, ll, op, out_len, t, wrkmem,
317*45ec975eSDave Rodgman 					&state_offset, bitstream_version);
3188b975bd3SMarkus F.X.J. Oberhumer 		ip += ll;
31964c70b1cSRichard Purdie 		op += *out_len;
3208b975bd3SMarkus F.X.J. Oberhumer 		l  -= ll;
32164c70b1cSRichard Purdie 	}
3228b975bd3SMarkus F.X.J. Oberhumer 	t += l;
32364c70b1cSRichard Purdie 
32464c70b1cSRichard Purdie 	if (t > 0) {
3258b975bd3SMarkus F.X.J. Oberhumer 		const unsigned char *ii = in + in_len - t;
32664c70b1cSRichard Purdie 
32764c70b1cSRichard Purdie 		if (op == out && t <= 238) {
32864c70b1cSRichard Purdie 			*op++ = (17 + t);
32964c70b1cSRichard Purdie 		} else if (t <= 3) {
3305ee4014aSDave Rodgman 			op[state_offset] |= t;
33164c70b1cSRichard Purdie 		} else if (t <= 18) {
33264c70b1cSRichard Purdie 			*op++ = (t - 3);
33364c70b1cSRichard Purdie 		} else {
33464c70b1cSRichard Purdie 			size_t tt = t - 18;
33564c70b1cSRichard Purdie 			*op++ = 0;
33664c70b1cSRichard Purdie 			while (tt > 255) {
33764c70b1cSRichard Purdie 				tt -= 255;
33864c70b1cSRichard Purdie 				*op++ = 0;
33964c70b1cSRichard Purdie 			}
34064c70b1cSRichard Purdie 			*op++ = tt;
34164c70b1cSRichard Purdie 		}
3428b975bd3SMarkus F.X.J. Oberhumer 		if (t >= 16) do {
3438b975bd3SMarkus F.X.J. Oberhumer 			COPY8(op, ii);
3448b975bd3SMarkus F.X.J. Oberhumer 			COPY8(op + 8, ii + 8);
3458b975bd3SMarkus F.X.J. Oberhumer 			op += 16;
3468b975bd3SMarkus F.X.J. Oberhumer 			ii += 16;
3478b975bd3SMarkus F.X.J. Oberhumer 			t -= 16;
3488b975bd3SMarkus F.X.J. Oberhumer 		} while (t >= 16);
3498b975bd3SMarkus F.X.J. Oberhumer 		if (t > 0) do {
35064c70b1cSRichard Purdie 			*op++ = *ii++;
35164c70b1cSRichard Purdie 		} while (--t > 0);
35264c70b1cSRichard Purdie 	}
35364c70b1cSRichard Purdie 
35464c70b1cSRichard Purdie 	*op++ = M4_MARKER | 1;
35564c70b1cSRichard Purdie 	*op++ = 0;
35664c70b1cSRichard Purdie 	*op++ = 0;
35764c70b1cSRichard Purdie 
35864c70b1cSRichard Purdie 	*out_len = op - out;
35964c70b1cSRichard Purdie 	return LZO_E_OK;
36064c70b1cSRichard Purdie }
361*45ec975eSDave Rodgman 
362*45ec975eSDave Rodgman int lzo1x_1_compress(const unsigned char *in, size_t in_len,
363*45ec975eSDave Rodgman 		     unsigned char *out, size_t *out_len,
364*45ec975eSDave Rodgman 		     void *wrkmem)
365*45ec975eSDave Rodgman {
366*45ec975eSDave Rodgman 	return lzogeneric1x_1_compress(in, in_len, out, out_len, wrkmem, 0);
367*45ec975eSDave Rodgman }
368*45ec975eSDave Rodgman 
369*45ec975eSDave Rodgman int lzorle1x_1_compress(const unsigned char *in, size_t in_len,
370*45ec975eSDave Rodgman 		     unsigned char *out, size_t *out_len,
371*45ec975eSDave Rodgman 		     void *wrkmem)
372*45ec975eSDave Rodgman {
373*45ec975eSDave Rodgman 	return lzogeneric1x_1_compress(in, in_len, out, out_len,
374*45ec975eSDave Rodgman 				       wrkmem, LZO_VERSION);
375*45ec975eSDave Rodgman }
376*45ec975eSDave Rodgman 
37764c70b1cSRichard Purdie EXPORT_SYMBOL_GPL(lzo1x_1_compress);
378*45ec975eSDave Rodgman EXPORT_SYMBOL_GPL(lzorle1x_1_compress);
37964c70b1cSRichard Purdie 
38064c70b1cSRichard Purdie MODULE_LICENSE("GPL");
38164c70b1cSRichard Purdie MODULE_DESCRIPTION("LZO1X-1 Compressor");
382